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حول المؤلف 
البروفيسور روب كيتشن 


هو باحث رئيسي s dat à‏ الأو رو للبحوث المتقدمه (European Research Council)‏ 
في جامعة إيرلندا الوطنية في ماينوث. وقد قام بتأليف وتحرير كتب عديدة أخرى ناهزت ثلاثة 
وعشرين LES‏ وكان قد حاز على الميدالية الذهبية للعلوم الاجتماعية من الأكاديمية الملكية 
الأبرلندية للعام YAY‏ وهو الباحث الرئيسي للحاوية الرقمية الأيرلندية والمرصد البحثي 
esas)‏ الجزيرة الأيرلندية. 
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قائمة الجداول 


الحدول الصفحة 
1١-١‏ مستويات قباس السانات د چ چ M ups‏ 
1-1 المستويات الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية M. uc‏ 
١-۴‏ الأدوات والعناصر لمجاميع البيانات A —n‏ عي 2 me‏ 
7-١‏ مقارنة البيانات الصغيرة والبيانات الكبيرة I. usage M t‏ 
Y-Y‏ أنواع وأمثلة البنى التحتية للبيانات NL Saar‏ 


Y-F‏ مجموغة منتقاة من مؤسسات تقديم المشورة» والضغظ لكسب التأييد. والتنسيق 
للمحافظة على البيانات وإتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم 


الاجتماعية والإنسانيه اا US. — RD‏ 

۲-٤‏ فوائد مستودعات البيانات والبنى التحتية للبيانات ES.‏ ——— 1م 

f Team .. للبيانات المفتوحة المتعلقة بتعريف الانفتاح‎ JELI الخصائص‎ ۲-١ 

a gag باو‎ rews. ` مبادئ منظمة الحوكمة المفتوحة للسانات المفتوحة‎ Y-Y 

N eem المفتوحة والسانات ال مرتبيطهة‎ LAU اطستويات الخمسة‎ Y-Y 
ae Lees ah sh aimo نماذج التمويل للبادرات البيانات المفتوحة‎ Y-t 

٤-١‏ مقايس السانات N AR... da l‏ ا 

1-1 مهام وأساليب التنقيب عن البيانات ا و وھ چ I" JH‏ 

HN LIEN أنماط ذكاء البيانات الكبيرة للشركات‎ ۷-١ 

VY فوائد البيانات الكبيرة لعشر صناعات مختارة و‎ ۷-٣ 

N Locman ز‎ ASAAN نماذج العلم الأربعة‎ ۸-١ 

PAU SS الخيرات اللازمة لبناء البنى التحتية للبيانات وإجراء بحوث الدسيانات الكيرة‎ 59-١ 

TAN  ————————————————— تصنيف الخصوصية‎ ٠١-١ 
"T occ Ei الممارسة العادلة للمعلومات‎ isola ٠١-٣ 
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OW —— ———— اطبادئ السبعة الأساسية للخصوصية من خلال التصميم‎ ٠٠-٤ 
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قائمة الأشكال الرسومية 
الشكل 


المواقع اللحظية لمسار الرحلات الجوية ED ERE‏ 
لوحة معلومات مدينة لندن الخاصة با مركز البريطاني للتحليل العمراني المتقدم 2-2 
مجموعة أدوات التحليلات الجغرافية الصورية التي وضعها المركز الوطني للتحليلات 
الصورية في جامعة ينكوبينج (Linköping University)‏ سا ست 
استخدام مجموعة أدوات التحليلات الجغرافية الصورية في بناء الرواية 
AURI AMEE Mem, MOT‏ 


التسويق والبيانات الكبيرة C——mo daa‏ 
مركز العمليات لوسط مدينة )$292 EPEE 0 gyl‏ ب چ چچچ م چچ چچ چچچ 
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شكر وتقدير: 

بدآت نشأة هذا الكتاب في أوائل الشهر السابع (يوليو/ (LT‏ من العام ٠١١1‏ خلال 
مناقشة بمقهى ف أدنيرة مع روبرت روجك (Robert Rojek)‏ من شركة سايج للنشر 
(SAGE)‏ حيث كنت قد اقترحت عليه البحث عن شخص لكتابة مصنف عن OLI‏ 
الكبيرة: والبيانات المفتوحة؛ والبنى التحتية للبيانات» مع تقديم الأفكار وإسداء النصح 
عن ذلك الشخص الذي قد يكون مناسبا لصياغة النض في مثل هذا الموضوع. وكان يرى ف 
auo‏ أنى ذلك الشخص امناسب لتلك المهمة. فقررت في وقت «87V‏ بعد مضي عدة coal‏ 
الموافقة بين خطط كتاباق والجمع بينهاء بحيث بدأت في صياغة ما بدا في متناول اليد خلال 
فترة زمنية قصيرة جدا ويتناؤل التحليل النقدي ممشهد البيانات المتغير باطراد. تطور الكتاب 
مع مرور الوقت إلى مخطوط كامل يسعى إلى الدراسة المستفيضة للاتجاهات والمناقشات 
الناشئه oto‏ وإنصاف. وبالتزامن مع «AUS‏ بقي روبرت متانعا + ومصدرا للعديد من 
امواد المثيرة للاهتمام» C555‏ مساعدته موضع تقدير كبير Jas‏ وق سايج Lal‏ ساعد زميله 
كيري ديكنز (Keri Dickens)‏ في الدفع بالكتاب إلى عملية الإنتاج والنشرء التى تم توجيهها 
على نحو مثير للإعجاب من قبل كاثرين هاو (Katherine Haw)‏ 


(Tracey P. Lauriault) وتريسي ب. لاوريولت‎ (Martin Dodge) مارتن دودج‎ eL 

بقراءة مفصلة ونقد هادف للمخطوط بالكامل وعلى نحو متناه ق السلاسة واللطف. وقام 
مارك بويل (Mark Boyle)‏ بقراءة كامل ال ملسودة AILI‏ كما قدم غافن مكاردل Gavin)‏ 
jy 25! s (McArdle‏ روبيرت (Evelyn Ruppert)‏ نقدا T‏ لبعض فصول الكتاب» وإضافة 
لذلك شارك عدد من الزملاء والأصدقاء في مداخلات نافعة ومناقشات مفيدةء حيث دلني العديد 
منهم إلى مواد «&Lo DIS‏ منهم مارك غراهام (Mark Graham)‏ تايلور شيلتون Taylor)‏ 
(Shelton‏ مات زوك (Matt Zook)‏ مات وىلسون (Matt Wilson)‏ ليف مانوفىتش Lev)‏ 
710+ سيان اوكالاهان «(Cian O'Callaghan)‏ سونغ - يوه بيرنج sung-Yueh)‏ 
dol Ll (Perng‏ كارول (Aileen O'Carroll)‏ جين جرای (Jane Gray)‏ ساندرا كولينز 
«(Sandra Collins)‏ 552 كيتنغ (John Keating)‏ شارون ويب (Sharon Webb)‏ جوستين 
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مهد 


جليسون «(Justin Gleeson)‏ أو یف داولنغ (Aoife Dowling)‏ يوغان مكار Eoghan) à‏ 
(McCarthy‏ مارتن تشارلتون «(Martin Charlton)‏ تيم مکار ole «(Tim McCarthy)‏ 
ريجبى «(Jan Rigby)‏ روب برادشو 5Vl «(Rob Bradshaw)‏ مور (Alan Moore)‏ دراش ماك 
دونشا (Darach Mac Donncha)‏ وجيم .(Jim White) Colg‏ كما تلقيت ;1393 مضدة PAF:‏ 
خلال العروض التقديممية في جامعة دورهام» وجامعة كلارك» وجامعة هارفارد. واهتمت رونا 
برادشوو (Rhona Bradshaw)‏ وأورلا دان (Orla Dunne)‏ بإدارة آعمال المكتب عندما كنت 
أحاول الانكباب على إجراء البحوث وكتابة الفصول. كما تفضلت جوستين جلسيون Justin)‏ 
(Gleeson‏ بإنتاج بعض الرسوم السانة. فأنا مدين S oS]‏ بالعرفان. كما أود Lal‏ شكر 
الكثير من الناس المشاركين على موقع التواصل الاجتماعي - التويتر وتغريداتهم التي أشارت إلى 
مواد مثيرة للاهتمام وانخراطهم في مناقشات علمية دقيقة ذات صلة. Kid Tin‏ موصول 
إلى كورا (Cora)‏ التي قامت بتشبيتي وقدمت bc‏ رائعا d‏ 

وتم دعم جزء من الأبحاث التي أجريت في كتابة هذا الكتاب من خلال جائزة المجلس 
الأوروبي للبحوث المتقدمة: "المدينة المبرمجة" ERC-2012-AdG-323636; www.nuim.)‏ 
(ie/progcity‏ والتمويل المقدم من هيئة التعليم العالي في برنامج البحوث في المستوى 
الثالث للدورة الخامسة؛ والذي يهدف إلى إنشاء حاوية رقمية لأبرلندا. 

ويمكن الاطلاع على نسخة من مراجع الكتاب من خلال الرابط التالي: http://‏ 
.thedatarevolutionbook.wordpress.com‏ كما يجري بانتظام إضافة مصادر 
للمعلومات وتجارب حول ثورة السانات على الرابط http://www.scoop.it/t/the-‏ 
.programmable-city‏ وبالطبع. فإن التعليقات والردود مرحب بها من خلال البريد 
الإلكترون Rob.Kitchingnuim.ie‏ أو التغريد على حساب موقع التواصل الاجتماعي 
robkitchine jo -‏ 


لقد سبق نشر بعض المواد الموجودة في هذا الكتاب على شكل أوراق بحثية أو على 
النشرات اليومية» على الرغم من أنه قد تم تحديتهاء وإعادة صياغتهاء والتوسع فيها. ومنها: 
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٠ Table 2.4 is included with the permission of Neil Beagrie, Brian Lavoie and 
Matthew Woollard and 

٠ under a creative commons licence for Fry et al, http://repository;jisc. 
ac.uk/279/. 

٠ Table 3.1 is reproduced from http://opendefinition.org/od/ under a creative 


commons licence. 
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Table 3.3 is included with the permission of Michael Hausenblas, 
http://5stardata.info/. 

Table 4.1 is reproduced with the permission of The Economist. The Economist 
Newspaper Limited, 

London, issued March 11, 2014. 

Figure 6.1 is reproduced with the permission of Monica Stephens. 

Table 6.1 is reproduced with the permission of Taylor and Francis. 

Figure 6.2 is reproduced with the permission of Flightradar24.com. 

Figure 6.3 is reproduced with the permission of Andrew Hudson-Smith. 
Figures 6.4 and 6.5 are reproduced with the permission of Professor Mikael 
Jern, National Center for 

Visual Analytics, Linkóping University, http://ncva.itn.liu.se. 

Table 7.1 Forms of big data corporate intelligence is included with the 
permission of McKinsey & 

Company. 

Table 7.2 and Figure 7.1 are reproduced courtesy of International Business 
Machines Corporation, © 

International Business Machines Corporation. 

Figure 7.2 is reproduced from http://ipprio.rio.rj.gov.br/centro-de-operacoes- 
rio-usa-mapas-feitospelo- 

ipp/ under a creative commons license. 

Tables 10.2 and 10.3 are included with the permission of John Wiley & Sons. 
Table 10.4 is included with the permission of Ann Cavoukian, Ph.D., 


Information and Privacy Commissioner, Ontario, Canada. 
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ملاحظة: 

يعبر عن مصطلح البيانات (Data)‏ في هذا الكتاب في صيغة الجمع» مع استخدام 
مصطلح وحدة بيان JY (Datum)‏ على اطثل ا مفرد (Singular Instance)‏ بحسب ما 
هو موضح في قاموس أوكسفورد للغة الانجليزية (Oxford English Dictionary- OED)‏ 

في اللغة اللاتينيةء البيانات هى صيغة جمع لكلمة بيان» وتاريخيا وف المجالات العلمية 
ا متخصصة» على الخصوص. يتم التعامل أيضا مع مصطلح «البيانات» للدلالة على الجمع 
في اللغة الإنجليزية. حيث b‏ في سياق Je‏ الجمع (were)‏ كما في »3 gaz‏ البيانات 
Im‏ 

ومع «MUS‏ يستخدم هذا المصطلح على نحو متزايد في صيغة المفرد في وسائل الإعلام 
العامة وال محادثة اليومية» كما جرى تفصيل ذلك ف قاموس أوكسفورد للغة الإنجليزية: 


ومع ذلكء» à‏ العموم لا يجري التعامل مع مصطلح d zua «bL UI»‏ الجمع à‏ 
الاستخدام غير العلمى الحديث. ولكن بدلا من US‏ يجرى التعامل معه كاسم إجمالي - 
للبند غير المعدود - على غرار كلمة «معلومات»» التي تأخذ الفعل بصيغة المفرد. وأصبح 
الحمل من قىىل: à «5L UI gem Q2»‏ سباق فعل ]5,5 «Was»‏ 

لذاء يتبع هذا الكتاب الاصطلاح العلمي امعمول به. ومع ذلك» تم إبقاء النص على all>‏ 
حيثما اتفق ورود استخدامه a Ahl TET‏ عند الاقتىاس. ودون الجدل à‏ أي الصغتين هو 
الأصح» فإن انحباز النحاة هو لصغة فعل الجمع: ولكن الاستخدام العام الشائع هو f‏ 
انفتاحا ومرونه. 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها w‏ 





-— 


المكتبة الاقتصادية 


قناة المكتبة على التيليجرام — ECONLIBRARY‏ © 





AA 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


+. 


مقدمه: 

هناك تاريخ طويل للحكومات» والأعمالء والعلوم» وا مواطنين فيما يتعلق بإنتاج واستخدام 
السانات cua‏ لجل رصد lol‏ وتنظيمة: والانتفاع منه» وجعله أكثر منطقا وذا مغزى. وقد 
كانت البيانات في العادة مكلفة وتستغرق وقتا Wgh‏ في الإنتاج والتحليل والتفسير وتوفر في 
العموم صورة «Ab‏ غالا مشوشة»ء 45529 عن الظاهرة قد الدراسة. ونظرا للندرة cdi)!‏ 
كانت السانات ذات الجودة العالىة سلعة ذات das‏ وعلى هذا الأساس كان التكتم الشديد 
والحرص عليها وتداولها وتبادلها بأثمان باهظة. ولكن هذا الوضع بدأ يتغير بشكل جذري 
Lau‏ فالبيانات لم تفقد شيئاً من قيمتهاء ولكن جرى في نواح أخرى تحول في طبيعتها 
وطرق انتاجها من خلال مجموعة ما وصفها )1997( Christensen‏ بالابتكارات ASK Ll‏ 
ilg‏ شكلت b asd‏ للوضع الراهن في كيفية إنتاج البيانات وإداراتها وتحليلها وتخزينها 
والاستفادة منها. فدلا من أن تكون السانات نادرة ومجدودة à‏ قدرة å‏ الوصول dy!‏ غدت 
على نحو متزايد طرق إنتاج البيانات كالطوفان؛ D.‏ ا اسا من السانات ås gahl‏ 
à‏ طبيعتيا. Lakis ála.5 hlo‏ والمتوافرة عند الحاجة إليها في الوقت ال مناسب. وال منخفضة 
baa‏ في التكلفة. وخارج نطاق الأعمال في طبيعتهاء مع تنامي فتحها وازدياد قابلية وسهولة 
الوصول إليها. فثورة البيانات جارية في الوقت «5l JI‏ وهي تعمل بالفعل على إعادة 
تشكيل كيفية إنتاج اممعرفةء وإجراء الأعمال» وحوكمة التشريعات والقوانين. 

لقن ات هذه الثورة في الموجة الأخيرة من تقنيات المعلومات والاتصالات (ICTs)‏ 
وذلك من خلال عدد كبير من الأجهزة الرقمية التي نصادفها اليوم في المنازلء وأماكن 
العملء والأماكن العامة؛ كأجهزة الاتصال ال محمولة» والحوسبة ال موزعة» والحوسية السحابة؛ 
ووسائل التواصل الاجتماعي؛ وإنترنت الأشياء (أجهزة ووسائل استشعار مترابطة ومتصلة 
من خلال الشبكة العالية -الإنترنت). فهذه الوسائط وال منصات التقنية الجديدة أضحت 
تقود وتوجه أكثر من أي وقت مضى المزيد من جوانب «les! - xcd Slol‏ واا 
والسفرء والاتصالء والترفيه - وأضحت العوالم التي نعيش فيها تفهم dug‏ سانات dona‏ 
من خلال التقنات المعتمدة على السانات. وعلاوة على US‏ فان هذه الوسائط والمنصات 
التقنبه الجديدة تعمل ماديا Lalis‏ على إعادة تشكيل طرق إنتاج» وتداول» وتفسير 
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البيانات» وإنتاج ما اصطلح على تسميته «البيانات الكبيرة «Big data‏ حيث كميات هائلة 
من البيانات الرقمية المتغيرة cde giblo‏ والتي من السهولة بمكان الجمع بينهاء وتبادلهاء 
وتوزيعها من خلال شبكات dui‏ المعلومات والاتصالات» وتحليلها بواسطة جيل جديد من 
أساليب تحليل البيانات (Data Analytics)‏ ال معدة لتتلاءم مع وفرة البيانات على العكس 
من ندرة البيانات المعتادة. ويتضح حجم طوفان البيانات الناشئة من خلال الادعاء ab‏ 
"من فجر الحضارة وحتى العام Y» «Y‏ أنتجت البشرية خمسة إكسا (Exabyte) Cob‏ 
من المعلومات فقط؛ في حين نحن بصدد إنشاء القدر نفسه من البيانات كل يومين" Hal)‏ 
aṣ- ,Varian, chief economist with Google‏ من 2012 .(Smolan and Erwitt‏ 

ولا تعد البيانات الكبيرة المكون الوحيد 3553 البيانات» فبالأحرى كان هناك العديد 
من المبادرات المتصلة بعضها ببعض من قبيل التحول الرقمي (Digitization)‏ ربط 
وتوسيع مجموعات البيانات المنتجة تقليديا (البيانات الصغيرة) مع بعضها عبر بنى تحتية 
شبكية؛ وحركة البيانات المفتوحة التي تسعى لجعل أكبر قذر ممكن من البيانات متوفرة 
بشكل مفتوح للجميع للاستخدام؛ والهياكل المؤسسية الجديدة التي تسعى لتأمين المبادئ 
التوجيهية والسياسات المشتركة فيما يتعلق بأنماط تنسيق «bU JI‏ ونماذج هيكلتهاء 
والبيانات الوصفية عنهاء وحقوق الملكية الفكرية. وتراخيص الاستخدام القانوني dy‏ ومعايير 
المشاركة بها. وتشكل هذه المبادرات مجتمعة مجموعة من مجاميع البيانات الجديدة 
- مزيج من نظم الفكرء وأشكال المعرفة: والتمويلء والاقتصادات السياسية» والتشريعات 
الحاكمة والجوانب القانونية وامادية الناظمة» والبني التحتيةء وال ممارسات. والمنظمات 
وا مؤسسات» والمجتمعات المحلية والشخصيات الاعتبارية» والأماكن: والأسواق - التي تؤطر 
لكيفية إنتاج البيانات والحدود القصوى لاستخداماتها ال ممكنة. 

ويظهر أثر البيانات الكبيرةء والبيانات ال مفتوحة: والبنى التحتية للبيانات بشكل جلي 
في مجالات العلوم» وقطاع الأعمالء والقطاع الحكوميء وال مجتمع المدني. فالتخصصات 
الجديدة التي تم استحداثها بدأت الآن بالتعامل مع تدفق البيانات الهائل بعد التعود 
على العمل في جزر البيانات «d$ ALI‏ والسعي نحو استخراج المعلومات» واستخلاص النتائج 
من عدد قليل نسسا من المشاهدات )2010 .(H.J. Miller‏ وقد اقترنت هذه التخصصات 
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مجالات جديدة.: مثل علوم البيانات (Data Science)‏ والحوسبة الاجتماعية Social)‏ 
8 2 والعلوم الإنسانية الرقمية (Digital Humanities)‏ والعلوم الاجتماعية 
الحاسوبية (Computational Social Sciences)‏ والتي تعنى JS o‏ واضح ببناء البنى 
التحتية للبيانات وإيجاد طرق مبتكرة لتحليل وفهم معنى البيانات عند توسعها وكبر 
حجمها. ففي قطاع الأعمالء توفر البيانات الكبيرة lwg‏ جديدة لإدارة جميع مناحي 
أنشطة الشركة بصورة مرنة وفعالة ويستفاد منها لتحقيق أرباح إضافية من خلال تعزيز 
الإنتاجيةء والقدرة التنافسية. وال معرفة بالسوق. كما أضحت السانات نفسها سلعة «dal‏ 
يتم شراؤها وبيعها مرارا في السوق العامية مليارات الدولارات. وبالنسبة للحكومات» وعلى 
نطاق واسع. توفر البيانات الديناميكية المتغيرة رؤى جديدة حول عملياتهاء فضلا عن 
إعادة تشكيل وسائل الحكم وتنظيم المجتمع. فمن خلال تفحص قواعد البيانات المفتوحة, 
يستخلص المواطنون والمنظمات غير الحكومية (NGOs)‏ النتائج الخاضة بهم» متحدين 
المنظمات التجارية الربحية والأجندات الحكومية» ويقدمون رؤى بديلة للكيفية التي 
ينبغي بها تنظيم ال مجتمع وإدارته. 

لقد أثارت هذه الفرص الجديدة طفرة حقيقية ملموسة في ما يمكن تسميته ب "تعزيز 
السيانات" «(Data Boosterism)‏ من خلال حشد الدعوات المىشرة بفوائد وافاق السبانات 
الكبيرة: والسانات المفتوحة: والبيانات الصغيرة الموسعة. والبعض من هذه الدعوات له 
ما يبرره» وبعضها الآخر مجرد غث وتهويل دعاق لا حقيقة له البتة. في LELI‏ أصبحت 
مصطلحات: البيانات الكبيرة والبيانات المفتوحة: أنماطا ثقافية قوية في الانتشار والتأثير 
(Memes- clas)‏ وليست مجرد وسيلة لوصف السانات ولكنها رمز لخطاب أوسع مدى 
يستخدم في حشد الدعم لها وانتشار اعتمادها والبدء في تطبيقها. فمع هذا الترويج 
والتعزيز أضحى من السهل الانجراف نحو تبني هذه ال مصطلحات دون انتقاد أو تمحيص 
للتغيرات التي تحدث والتى أثار العديد منها مخاوف أخلاقية» ومحاذير سياسية وقانونية. 
ورغم ذلك» فقد كشف التاريخ فيما مضى عن سوابق من الابتكارات ال مربكة المتعلقة 
با معلومات - على سبيل JELI‏ التحول الجذري في إنتاج المعرفة في أعقاب اختراع الطابعة. 
ومن حيث الواقع» فقد صاحب بداية كل ع صر جديد من olol‏ تقنيات جديدة أدت إلى 
زيادة مفرطة في البيانات وكانت بمثابة شرارة التحول نحو طرق جديدة لإنتاج» وتنظيم: 
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52955 »3« وتحليل» وتفسر البيانات )2000 .(Darnton‏ على سبيل «JUL‏ من ملاحظات 
(Strasser 2012)‏ فإن الاستكشافات في «aJ! pac‏ والتى تعززت بفعل أدوات duale‏ 
أفضل في الملاحة. ورسم الخرائطء قد أسفرت عن كميات ila‏ من الاكتشافات الجديدة 
التي أدت إلى وسائل جديدة للتصنيف» وتقنيات جديدة في التحليل والتخزين: وأفكار 
deale‏ جديدة. 

ونظرا للمرحلة المبكرة نسبيا في ثورة البيانات الحالية» فإنه ليس من المؤكد تماما كيف 
ستتكشف وتستقر التحولات الحاليةء وما الذي سيكون عليه نطاق عواقب التغيرات التي 
تحدث من منظور أوسع. فالواضح هو أن هناك حاجة ملحة لمحاولة الإدراك والشعور Le‏ 
يحدث. وهكذاء فإن الهدف من هذا OLSI‏ هو تقديم «JU‏ وتحليل مبدني ودقيق 
do Lodi 2 1 1118555 cobL.U‏ خالا فهذا الان کی Ra‏ یی Shil‏ 
والوسائل المتعلقة بإعادة تشكيل e L5]‏ ومعالجة وتحليل وتبادل البيانات. وما يعنيه هذا 
لكيفية إنتاج واستخذام ال معلومات وال معرفة؛ وهو من جهة أخرى مهد للنقاش والتفكير 
النقدي حول البيانات: طبيعتهاء وكيفية تأطيرها من النواحي الفنية والفلس dà‏ والأخلاقية 
والاقتصادية والتجميعات التقنية والمؤسسية ال محيطة بها. وبدلا من أن تتحدد فوائد 
البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات من خلال حالة عاطفية» أو 
نقد لاذع يشجب نتائج العواقب الأكثر سلبية da)‏ يقدم OLSI‏ تقييما نقديا موضوعيا 
للتغييرات التي تحدث. 

ويستند التحليل المقدم في هذا الكتاب على مشاركة واسعة النطاق مما سبقه من 
مؤلفات في مختلف العلوم» والعلوم ASLINI‏ والعلوم الاجتماعية. ومن مطبوعات الثقافة 
الشعبية» والإصدارات الصحافية. والدوريات الصناعية:ء وعلى خبرة مباشرة (à‏ العمل على 
أنظمة حفظ ià djl‏ وبنى LinS‏ ومشاريع تحلىلات OBL‏ على نطاق مؤسسي واسع. 
وينقسم الكتاب إلى أحد عشر فصلا. يقدم الفصل الأول ملحة عامة TU"‏ فكريا حول 
مفهوم البيانات وكيفية فهم قواعد البيانات والبنى التحتية للبيانات. ويبحث الفصل 
الثاني في الدور ال مستمر للبيانات الصغيرة والكيفية التي تم بها توسيع نطاقها إلى أرشيفات/ 
محفوظات رقمية وبنى daos‏ إلى أن وصلت إلى درجة التداول وبيعها من خلال وسطاء 
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البيانات. كما يناقش الفصل الثالث الدافع للتوجه نحو استحداث البيانات المفتوحة 
والبيانات المرتبطة التي يجري تقاسمها ومشاركتها وإعادة استخدامها على نطاق أوسع 
مرور الوقت. ويبين الفصلان الرابع والخامس طبيعة البيانات الكبيرة بالتفصيل وعوامل 
التمكين للبيانات الكبيرة ومصادرها المساعدة على انتشارهاء في حين piä‏ الفصل السادس 
dl‏ عامة عن مجموعة جديدة من تحليلات البيانات التي ترمي إلى فهم البيانات الصغيرة 
اموسعة والبيانات الكبيرة. كما يدرس الفصلان التاليان (السابع والثامن) الحجج ال مستخدمة 
لتعزيز البيانات الكبيرة والترويج لها وبيان تأثيرها في الحوكمة والأعمالء والسبل التي تقوم 
بها ثورة البيانات على إعادة تشكيل كيفية تصور البحوث وممارستها. ويناقش الفصلان 
التاسع والعاشر التحديات التقنية والتنظيمية» والأخلاقيةء والسياسية. والقانونية لثورة 
البيانات. ويحدد الفصل الأخير بعض الاستنتاجات الكلية ويقدم خارطة طريق لإجراء 
ا مزيد من البحث والتاصيل. 
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الفصل الأول 
تصور لمفهوم البيانات (Conceptualising Data)‏ 


يتم فهم البيانات عادة على أنها المادة الخام التي تنتجها طرق تجريد العوامم من حولنا 
والتعبير عنها من خلال فئات» ومقاييس» وأشكال تمثيلية أخرى - كالأرقام» والحروف. 
والرموزء والصورء والأصوات» ole sls‏ الكهرومغناطيسية» والثنائية الرقمية - تشكل اللبنات 
الأساسية في بناء صروح المعلومات وا معرفة. ومع أن البيانات تعد بطبيعتها مُعبرة ومُمثلة 
للأشياء (على سيل JELI‏ القياسات المتعلقة بظاهرة ما كعمر الشخصء طوله» 4359« dg)‏ 
ضغط دة doy‏ ازو مان إقامتة. وما إلى ذلك): إلا ]45 esa‏ ان تكون أيضا 
ضمنية (من خَلآل:الغياب بدلا من الوجود)» أو مُشتقة عاق سبيل OLI JL‏ التي يتم 
إنتاجها من البيانات الأخرى كالنسبة المئوية للتغير مع مرور الوقت والتي يتم احتسابها 
من خلال مقارنة البيانات من فترتين زمنيتين مختلفتينء ويمكن أن تكون البيانات مسجلة 
ومخزنة إما في شكل تناظري (Analog)‏ أو من خلال ترميزها في شكل رقمي كأرقام ثنائية 
.(Bits)‏ وتتصف البيانات بأنها ذات جودة جيدة إذا كانت منفصلة وواضحة معنى أن 
تكون كل وحدة بيان (Datum)‏ 65,25( ومستقلة وقابلة للانفصال. ومعرفة بشكل «Quels‏ 
وتراكمية قابلة للحصر (يمكن أن تبنى في مجموعات)ء ومرتبطة ببيانات وصفية لها (بيانات 
عن البيانات)ء ويمكن ربطها مجموعات بيانات أخرى لتقديم رؤى وأفكار غير متوفرة من 
مجموعة بيانات واحدة )2013 (Rosenberg‏ وتتمتع البيانات باستخدام قوي وقيمة 
عالية كونها توفر ال مدخلات الأساسية لكافة مراحل التحليل التي يجري توظيفها من قبل 
الأفراد. والمؤسساتء وقطاعات العلوم والأعمال لفهم وتفسير العام الذي نعيش 443« والتى 
تستخده بدورها لاستحداث الابتكارات» اممنتحات» السباسات» واطعارف التى تشكل الكيفية 
التي يعيش بها الناس حياتهم. 

ومن هناء تعذ البيانات موردا رئيسيا ف العصر الحديث. ومع ذلك ونظرا لفائدتها 
وقيمتهاء ومقدار الجهد وال موارد ا مخصصة لإنتاجها وتحليلهاء فمن اللافت للنظر كيف تم 
إيلاء القليل من الاهتمام للتصور ال مفاهيمي والإدراك aul‏ للبيانات في حد ذاتهاء وف 
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المقابل» هناك الآلاف من المقالات والكتب المكرسة لفلسفة ال معلومات وال معرفة. فكما أننا 
نميل في العادة للتركيز على المباني والأحياء عندما ننظر إلى oahl‏ بدلا من الطوب والإسمنت 
المستخدم ف بنائهاء فكذلك هو الحال مع البيانات. وعلاوة على ذلك» وبا مثل» كما bazel‏ 
التفكير بالطوب والإسمنت بصفتها مجرد وحدات بنيوية بدلا من عناصر تم تصنيعها داخل 
مصانع من قبل شركات ملزمة ضمن اعتبارات لوجستية ومالية وقانونية» dlg‏ يتم توزيعهاء 
وتخزينهاء وتداولهاء كذلك حالنا إلى حد كبير في التعامل مع البيانات. ونتيجة eUI‏ وعندما 
تكون البيانات هي محور التساؤل والاهتمام» عادة ما يتم النظرء باممعنى التقني إلى حد 
كبير» إلى الكيفية التي ينبغي بها إنتاج وتحليل البيانات» أو الكيفية التي يمكن بها الاستفادة 
منها في إنتاج رؤى وقيم» وليس زيادة النظر في طبيعة البيانات من منظور مفاهيمي 
وفلسفي. 

ومع الأخذ بهذه الملاحظة في الاعتبارء فإن الهدف الرئيسي من هذا الكتاب هو مركب 
ثلاني الأبعاد. فيه: توفير شرح تفصيلي عن طبيعة البيانات ومجاميعها على نطاق أوسع؛ 
وإيضاح الكيفية التي تتحول فيها هذه المجاميع وتتحور مع تطوير بنى تحتية جديدة 
للبيانات» والبيانات اممفتوحة» والبيانات الكبيرة؛ والتفكير المعمق ف الاثار المترتبة عن هذه 
المجاميع الجديدة للبيانات فيما يتعلق بكيفية استشعار العام المحيط بنا والتعاطي معه. 
ولتوفير منهاج مفاهيمي وتصور ose‏ أولي» سيتم في هذا الفصل فحص أنماط البيانات 
وأطرهاء وطبيعتهاء والقواعد الفلسفية لها بالتفصيل. وبعيدا عن كونها وخدات بنيوية 
بسيطة: تكشف المناقشة عن أن البيانات أكثر تعقيدا مما كنا نظن. ففي حين يقبل 
العديد من المحللين البيانات على ظاهرهاء ويعاملونها كما لو أنها محايدة وموضوعية 
وقابلة مسبقا للتخمين والتحليل في طبيعتها. إلا أن البيانات مؤطرة في الواقع من الناحية 
الفنية. والأخلاقيةء والاقتصادية: والزمانية» والمكانية: والفلسفية. فالسانات لا مكن أن 
توجد بشكل مستقل عن الأفكارء والأدوات» وال ممارسات» والسباقات» وال معارف المستخدمة 
لانتاحهاء ومعالجتهاء وتحلبلها )2013 diJa .(Bowker 2005; Gitelman and Jackson‏ 
فإن الحُجة المقدمة هي أن فهم البيانات وثورة البيانات الجارية حالياً يتطلب تحليلا أكثر 
دقة من ذلك الذي تستعرضه الكثير من الأدبيات ذات الصلة بالبيانات ا مفتوحة والبيانات 
الكبيرة في وقتنا الحاضر. 
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تصور ممفهوم البيانات 


ماهية السانات: 
بشكل اشتقاقيء فإن كلمة البيانات «Data»‏ مشتقة من الكلمة اللاتينية «Dare»‏ 
التي تعني ob»‏ تعطي». وبهذا (uis‏ فإن البيانات هي عناصر خام يمكن استخراجها من 
أو تعطى بواسطة ظاهرة معينة يجري قياسها وتسجيلها بطرق مختلفة. ولكن البيانات 
تشير في الاستخدام العام إلى تلك العناصر التي تؤخذ وتستخرج من خلال الملاحظات: 
والحسابات» والتجارب» وحفظ السحلات )2007 Ul .(Borgman‏ من الناحية الفنية: 
فما نفهمه من بانات lpi‏ في الواقع التقاطات «Capta»‏ والمشتقة من الكلمة اللاتينية 
«Capere»‏ والتي تعني «الأخذ»؛ أي تلك الوحدات من البيانات التي تم اختيارها 
وانتقاؤها من gaxo‏ £ كل البيانات ال محتملة )2011 .(Kitchin and Dodge‏ كما قال 
ix :1950)‏ مقس من Becker 1952: 278) Jensen‏ : 
كان حادثا TW‏ في التاريخ أن يستخدم المصطلح بان «Datum»‏ بدلا من 
مصطلح لقطة «Captum»‏ للدلالة على وصف وحدة الظاهرة ني العلوم. وهی 
ليست المناولات العلمية التي منحتها الطبيعة bl‏ ولكن ال مناولات التي أخذت 
أو انتقيت من الطبيعة من قبل العام نفسه وفقا لهدفه. 
من ثم. وبا معنى الدقيق للكلمة: ينبغي على الكتاب أن يعنون بثورة اللقطة 
.«The Capta Revolution»‏ ومع «US‏ ولأن مصطلح البيانات «Data»‏ قد أصبح 
متأضلا ق لغة الاستخدام الأكادمي وقطاع الأعمال لتعنى اللقطة «Capta»‏ وبدلا 
من الخلط واللغط أكثر à‏ هذه ULLI‏ فمن المنطقي امتابعة والاستمرار في استخدام 
مصطلح البيانات «Data»‏ مع أن اعتماد مصطلح اللقطة «Capta»‏ أكثر ملائمة في 
الاستخدام. وبعد تجاوز تسليط الضوء على جذور الاشتقاق اللغوي لهذا ا مصطلح. 
فإن هذه المناقشة الوجيزة تبدأ في تسليط الضوء على أن البيانات التي يتم جمعها 
من خلال القياس هي دائها de Si‏ منتقاة من مجموع كل البيانات امحتملة - 
والتى اخترنا التقاطها من كل ال معطيات ال ممكنة. (Aes‏ هذا النحوء تكون البيانات 
جزئية بطبيعتهاء انتقائية» وممثلة. مع أهمية المعايير المميزة المستخدمة ف التقاطها. 
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وقد لاحظ علماء آخرون أن ما تم فهمه على أنه «البيانات» قد تغير مع مرور الزمن 
وتطور العلم. فقد بين )2013 (Rosenberg‏ بأن مصطلح «البيانات» استخدم لأول مرة 
باللغة الإنجليزية في القرن السابع عشر. وارتبط كمفهوم إلى حد كبير بالحداثة والنمو 
والتطور المصاحب للعلوم» والطرق الجديدة في إنتاج» وعرض» ومناقشه امعرفه في القرنين 
السابع عشر والثامن عشر والتي انتقلت بعيدا عن اللاهوت» Begla‏ والعواطف إلى 
الحقائق والأدلة واختبار النظرية من خلال التجربة ;2013 (Poovey 1998; Garvey‏ 
Rosenberg 2013)‏ ومع مرور الوقت. جاء فهم السانات على أنها سابقة للتحليلء 
وهي ما قبل اتخاذ صفة الواقعية. وتختلف في طبيعتها عن الحقائقء Yla‏ وا لمعلومات. 
وا معرفةء ولكنها pais‏ مؤسس في تكوين جميع هذه العناصر على الرغم» في الغالب» من 
اختلاط التعاريف وال مصطلحات المستخدمة في وصف البيانات» الحقائقء «dà ys aJ‏ 
والمعلومات بحسب ما أشار (Rosenberg 2013: 18) aJl‏ حين SS‏ أن: 


الحقائق وجودية (Ontological)‏ والأدلة معرفيبة (Epistemology)‏ 

والسانات بلاغية .(Rhetorical)‏ وتكون وحدة السان «Datum»‏ حقيقة Lal‏ 

كما قد تكون الحقيقة في واقع Ma m‏ على أن وجود وحدة السان «Datum»‏ 

يعد TRA‏ دون أي اعتبار للحقيقة الوجودية Corresponding) à liil‏ 

.(Ontological Truth‏ وعند نفي الحقيقة وإثبات عدم صحتهاء فإنها تتوقف 

عن كونها حقيقة. فالبيانات الكاذبة هي بيانات مع ذلك. 

وبحسب الل مصطلحات/التعابير البلاغية» فالبيانات هي تلك التي توجد قبل النقاش أو 
التفسير الذي بحولها إلى حقائق» وأدلةء ومعلومات )2013 .(Rosenberg‏ ومن هذا المنظور 
تحمل البيانات مفاهيم مميزة: فهي تكون بذلك مجردة: ومنفصلة» وتراكمية (يمكن الجمع 
(Rosenberg 2013) (ys‏ وذات معنى مستقل عن Mäll‏ واللغة: وامنتج لهاء والسياق 
(معنى» أن تحمل البيانات معناها سواء تم تخزينها بصورة تناظرية (Analog)‏ أو رقمية 
(Digital)‏ أو تم عرضها على الورق أو الشاشة أو تم التعبير عنها ds) db‏ أو تم تقييدها 
بأنماط محددة غير متغيرة» مثل إشارة عدد الحلقات في جذوع الأشجار لعمر الشجرة والذي 
يكون .(Floridi 2010) (4 lola ls:‏ ويؤكد )2008 ol (Floridi‏ دعم استقلال السانات 
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تصور لمفهوم البيانات 


قائم على 453b‏ أنواع من الحيادية هى: التصنيفية (Taxonmic)‏ كون البيانات ny‏ كانات 
علائقة معرفه ددا بالنسبة إلى سانات خاصة أخرى؛ والطوبوغرافية (Typological)‏ 
لأنه مكن للبيانات اتخاذ أشكال مختلفة منفصلة بعضها عن بعضء على سبيل «JULI‏ 
الشكل الأساسيء الثانوي. الوصفيء التشغيليء والمشتق؛ والجينية (Genetic)‏ كون البيانات 
تمتلك دلالات مستقلة عن مدى فهمهاء فعلى سبيل «JULI‏ تشكل الهيروغليفية على حجر 
الرشيد بيانات بغض النظر عن حقيقة أنه عند اكتشافه لمم مكن لأحد أن يفسرها. 

وفي واقع الأمر ليس كل من يفكر أو يشتغل بالبيانات يحمل هذه النظرة البلاغية 
الضيقة. ففهم البيانات b‏ يتطور مع مرور الوقت فحسب» بل اختلف هذا الفهم بحسب 
منظور الفهم ووجهة النظر للبيانات. على سبيل JUL‏ أوضح )2008 (Floridi‏ أن البيانات 
من المنظور ال معرفي هي مجموعات من الحقائق» ومن المنظور المعلوماني البيانات هي 
معلومات» ومن منظور الحوسبة التقنية البيانات هي مجموعات من العناصر الثنائية التي 
يمكن معالجتها ونقلها إلكترونياء ومن المنظور العام (Diaphoric)‏ البيانات هي عناصر 
مجردة بتميز واضح وملموس من البيانات الأخرىء ففي الحالة الأولى» توفر البيانات الأساس 
طزيد من الاستدلال أو تشكل الأدلة التجريبية. وف ال مجموعة الثانيةء تشكل البيانات 
معلومات تمثيلية /ممثلة ممكن تخزينها ومعالجتها وتحليلهاء ولكن لا تشكل بالضرورة 
حقائق. أما في المجموعة AILI‏ فتشكل البيانات المدخلات وال مخرجات من الحوسبة ولكن 
ينبغي معالجتها لتحويلها إلى حقائق ومعلومات على سبيل JALI‏ يحتوي القرص الرقمي 
المدمج (DVD)‏ على غيغابايت من البيانات» وهي ليست وقائع أو معلومات بحد ذاتها 
(فلوريديء (YO‏ ف المنظور الرابع» تكون البيانات ذات مغزى لأنها التقاط ودلالة على 
التنوع والتغيير على سبيل JELI‏ أنماط من النقاطء والحروف الأبجدية «el MIS‏ والموجات 
الطولية التي تقدم إشارة ممكن تفسيرها. وكما هو مبين olol‏ قد يشمل فهم البيانات 
مناظير أخرى مثل الفهم القائم على اغتناز so OGLI‏ اجتماعياء أو امتلآك النبانات وجودا 
بن أو تحميلها مضامين إيديولوجية: أو اعتبارها delw‏ يتم تداولها الاتجار بهاء أو أنها 
تشكل منفعة dole‏ وغير ذلك من اطفاهيم الموجودة. والنقطة الأساسية هناء أن السانات 
م تكن أبدا ببساطة مجرد بيانات. حيث تختلف الكيفية التى يتم فيها تصور البيانات 
واستخدامها من قبل أولئك الذين يجمعون. ويحللون» ويستخلصون النتائج منها. 
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أنواع السيانات: 

سواء كانت البيانات بطبيعتها قابلة للتخمين (تم التكهن قبل التحقق منها) ومطابقة 
بلاغيا أو لاء فمن الواضح أن البيانات متنوعة في خصائصهاء مما يحدّد بعبارات واضحة 
dis‏ التعامل منعها وما هكن القياع به من خلالها: dale dass‏ تخطف البياتات بحسب 
النموذج (النوعي el‏ الكمّي)»: والهيكل (المنظم» أو شبه المنظم» أو الغير منظم)ء وال مصدر 
(مسجلة: أم مشتقةء el‏ مستنفذة: أم (öyle‏ والمنتج (رئيسي, أو ثانوي» أو «(ele‏ والنوع 
انات dis xal‏ أو اناك «duel‏ أو اتات وة 


السانات الكمية (Quantitative Data)‏ والسانات النوعية (Qualitative Data)‏ : 
من الممكن أن تتخذ البيانات العديد من الأشكال المادية متضمنا ذلك «ali SI‏ والنصوص, 
والرموزء والصورء والصوت,. والموجات الكهرومغناطيسية» أو حتى الفراغ sl‏ الصمت (فالفضاء 
الفارغ هو في حد ذاته بيانات). وتنقسم هذه البيانات ف العادة إلى فئتين رئيسيتين: 
البيانات الكمية والبيانات النوعية. فالبيانات الكمية تتكون من سجلات da)‏ وبشكل عام 
تكون هذه البيانات واسعة النطاق وتتعلق بالخصائنص الفيزيانية للظواهر (مثل الطولء 
الارتفاع» ا مسافة: الوزن» à Lll‏ والحجم). أو تكون تمثيلية وتتعلق بالخصائص غير المادية 
للظواهر (مثل الطبقه الاجتماعية» المستوى التعليمي» الحرمان الاجتماعي» وتصنيفات 
مستوى المعيشة). وللبيانات الكمية أربعة مستويات مختلفة لاقياس والتي تحدد LAS‏ 
معالحتها وتحلىلها )1999 Kitchin and Tate‏ وانظر bal‏ الحدول .)١-١‏ ومكن تحليل 
هذه البيانات باستخدام العروض اطرئية» ومجموعة متنوعة من طرق sLaz Vl‏ الوصفي 
والاستدلالي» وتستخدم باعتبارها مدخلات للنماذج التنبؤية وتنماذج المحاكاة. 
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)١-١( الجدول‎ 


مستويات قياس البيانات 


m التعريف‎ — 


البيانات الاسمية فئوية بطبيعتهاء مع تسجيل المشاهدات 
(Nominal data)‏ في وحدات قياس منفصلة. 


البيانات النظامية الترتيبية | ترتب ال مشاهدات ف فئات منظمة. حيث 
yas (Ordinal data)‏ مشاهدات هي Sl‏ من غيرها. 
يانات sl) àxàJl‏ المسافة) | OLLI azz‏ على طول مقياس يتضمن درجة الحرارة 
(Interval data)‏ الفترة أو المسافة بين نقطة أصل ثابته على المقياس المتوى 
وأخرى متغيرة. ولا تتغير طبيعة فترة 
المشاهدات ق هذا النوع من القياسات 
عند الإضافة أو المضاعفة مقدار ثابت. 
ويمكن أن تكون قيمة البيانات متضلة 
ule)‏ سبيل «JULI‏ الوقت أو الطول) أو 
منفصلة /متقطعة (على سيل sas «JULI‏ 
مرات المشاهدة) في الطبيعة. 






(Celsius scale) 





مماثلة لسانات الفترة عدا أنها ذات 
hi‏ 4 اصل صفرية حقيقية: كما ان 
المضاعفة بمقدار ثابت لن تغير الطبيعة 
النسية للمشاهدة. 

وقي امقابل. فإن البيانات degil‏ هي Oblo‏ غير عددية, مثل النصوصء الصورء الفنء 
الفيديوء الأصوات» والموسيقا. وبرغم أنه يمكن تحويل البيانات النوعية إلى بيانات AaS‏ 
VI‏ أن ذلك يتضمن خفضا وتجريدا كبيرين وخسارة eld‏ البيانات الأصلية نتيجة لعملية 
التحويل. ولذاء فإن عملية تحليل البيانات النوعية تمارس ف العادة على المواد الأصليةء سعيا 
لاستخلاص وبناء المعنى والفهم بدلا من إخضاع البيانات ومجرد إمرارها لتقنيات حاسوبية. 
ومع «US‏ فقد تم إحراز تقدّم كبير فيما يتعلق بمعالجة وتحليل OLLI‏ النوعية حاسوبيا 
من خلال عدد من التقنيات Jia‏ التعلم JYI‏ والتنقيب في البيانات (انظر الفصل السادس). 





dode‏ الاختبار على مقياس 
من صفر-١٠٠‏ 





البيانات النسبية 
(Ratio data)‏ 
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الفصل الأول 


السانات المنظمة (Structured Data)‏ والسانات غير المنظمة «(Unstructured Data)‏ 
والسسانات الشبه المنظمة :(Semi-structured Data)‏ 

البيانات ال منظمة هي تلك البيانات التي يمكن تنظيمهاء وتخزينهاء ونقلها بسهولة من خلال 
نموذج بيانات محدد» مثل قائمة الأرقام والنصوص الواردة في جدول أو قاعدة بيانات علائقية 
ذات تنسيق ثابت موحد (على سبيل JELI‏ الاسم. تاريخ ال ميلاد. العنوان»ء الجنس.... إلخ). 
ويمكن معالجة هذه البيانات» والبحث فيهاء والاستعلام عنهاء والجمع بينهاء وتحليلها بشكل 
مباشر نسبياً باستخدام حساب التفاضل والتكامل والخوارزميات» كما يمكن تمثيلها صوريا 
باستخدام أشكال مختلفة من الرسومات البيانية والخرائطء ومعالجتها بسهولة من قبل 
أجهزة الحاسب YDI‏ آما البيانات الشبه المنظمة فهي بيانات ذات تنظيم/ هيكل فضفاض 
وليس لها نموذج أو مخطط مسبقء ومن ثم لا يمكن تقييدها ضمن قاعدة بيانات علائقية. 
وتكون بنية البلآنات الشبه اللنظمة غير متسقة: وضظنية. LEi og‏ ما تتداخل في 
شبكة ذات شكل هرمي» ولكنها في ذات الوقت تتمتع مجموعة متسقة بشكل كبير من 
حقول البيانات» ويتم تمييز كل منها بوسم مميزء ومن ثم GLE‏ فصل ال محتوى بصورة دلالية 
وتوفير بيانات وصفية ذاتية التعريف بصورة مرنة واستخدامها وسيلة لفرز وترتيب وهيكلة 
البيانات. ومن الأمثلة على السانات 3 4 ال منظمة صفحات الويب ال موسومة بلغة التوصيف 
الموسعة (Extensible Markup Language- XML)‏ وهی الصفحات التي oem‏ لغة 
التوصيف الموسعة (XML).‏ لتنسيق وترميز المستندات بصورة قابلة للقراءة UT‏ وبشريا في 
ان واحد؛ 2012 Franks‏ انظر البيانات المرتبطة (à‏ الفصل الثالث). 


في المقابلء لا تمتلك البيانات غير المنظمة نموذج بيانات محدّدا أو هيكلا تعريفيا مشتركا. 
ولكن قد يكون لكل عنصر على حدة Si‏ أو هيكل six‏ خاص «t‏ مثل polis‏ النص 
الروائي أو الصورةء ولكن ليس كل البيانات ضمن مجموعة البيانات لها الهيكل نفسه. 
على هذا النحوء وبينما يمكن ف الغالب البحث والاستعلام عن البيانات غير المنظمة» إلا 
أنه ليس من السهل الجمع بينها وتحليلها باستخدام الحاسب الآلي. وتكون البيانات غير 
المنظمة نوعية بطبيعتهاء ولكن من الممكن في أغلب الأحيان تحويلها إلى بيانات منظمة 
من خلال الفرز والتصنيف. وحتى وقت قريب مهنا كانت مجموعات البيانات الكبيرة 
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جدا تحوي في العموم بيانات منظمة كونها أسهل بكثير في المعالجة والتحليل والتخزين 
على هذه الحال. أما في عصر البيانات الكبيرةء فقد تكونت العديد من مجموعات البيانات 
الضخمة التي تحوي بيانات شبه منظمة أو غير منظمة» مثل التي أنتجتها المشاركات 
الاجتماعية الجماعية على مواقع التواصل الاجتماعي مثل الفيسبوكء التغريدات على تويتر 
الصور ومقاطع الفيديو المرفوعة على الشبكة Ablo‏ والمدونات S| (Blogs)‏ تشير بعض 
التوقعات إلى معدل زيادة في نمو هذه البيانات غير ال منظمة أو الشبه ال منظمة بمقدار خمسة 
عشر liso‏ عن السانات المنظمة )2012 (Zikopoulos et al.‏ وقد صاحب ذلك تطودٌ 
في تصميم قواعد البيانات مثل قواعد البيانات غير العلاقية (NoSQL)‏ والتي لا تستخدم 
النماذج الجدولية أو قواعد البيانات العلائقية. انظر الجدول رقم 0( وتقنيات التعلم JYI‏ 
التي تساعد في التخزين والتحليل (انظر الفصل السادس). 


الببانات الملتقطة (Captured Data)‏ والبيانات المستنفدة/ المستهلكة 
c (Exhaust Data)‏ والسيانات العابرة «(Transient Data)‏ والسانات المشتقة / 
المستمدة :(Derived Data)‏ 

هناك طريقتان رئيسيتان لإنتاج البيانات: الأولى هي أنه من الممكن الحصول على 
البيانات بصورة مباشرة من خلال شكل من أشكال القياس مثل الطملاحظةء واطسح «Alu‏ 
والتجارب المخرية وال ميدانية» وحفظ السجلات (على سبيل «JULI‏ ملء الاستمارات أو كتابة 
المدونات): والكاميرات» وا ماسحات الضوئيةء وأجهزة الاستشعار. وف هذه الحالاتء عادة 
ما تكون البيانات هي المنتج المطلوب للقياس؛ أي أن النية هي إنتاج بيانات مفيدة. وفي 
المقابلء يتم إنتاج البيانات المستنفدة بالأصل بواسطة جهاز أو نظام وتكون ناتج وظيفة 
رئيسية وليست ال مخرج الرئيسي )2011 .(Manyika et al.‏ فعلى سبيل ob JULI‏ جهاز 
تسجيل الخروج الإلكتروني المصمم لاحتساب إجمالي البضائع التي تم شراؤها ومعالجة 
عملية الدفع لها من الممكن أن ينتج WIS‏ بيانات تستخدم لمراقبة المخزونء وأداء العاملينء 
وعمليات شراء العملاء. وتنتج العديد من الأنظمة المحوسبة Jis‏ هذه البيانات المستنفدة 
والتي أصبح الكثير منها مصدرا قيما للبيانات. وف حالات أخرى: فإن البيانات المستنفدة 
تبقى بيانات عابرة بطبيعتها؛ آي أنه لم يسبق أن جرى فحصها أو معالجتها ولذا فإنه يجري 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها T‏ 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الأول 


التخلص منهاء إما لأنها ضخمة جدا أو غير منظمة بطبيعتهاء أو مكلفة في المعالجة والتخزين, 
أو أنه يوجد نقص في تقنيات استخلاص القيمة منهاء أو لقلة الاستخدام الإستراتيجي أو 
التكتيكى لها )2012 .(Zikopoulos et al. 2012; Franks‏ ومن الأمثلة على ذلك ما ذكره 
Manyika et al. (2011: 3)‏ من òl‏ "مقدمي خدمات الرعاية الصحية.... يتجاهلون 51١‏ 
من البيانات التي ينتجونها (كالفيديوهات المسجلة أثناء العمليات الجراحية)". 

al معنی أنه م يتم تحويلها‎ «elo» Ollo البيانات الملتقطة والبيانات ال مستنفدة‎ Asóg 
إنتاج البيانات المشتقة من خلال عمليات‎ ex Läb ضمّها مع غيرها من البيانات. وف‎ 
قد تكون‎ JULI إضافية من المعالجة والتحليل للبيانات التي تم التقاطها. فعلى سبيل‎ 
البيانات هي تعداد حركة الأفراد على أحد التقاطعات المرورية والبيانات ال مشتقة منها هي‎ 
التعداد الإجمالي أو التعداد لكل ساعة: فالبيانات الأخيرة استمدت من البيانات السابقة.‎ 
وتكون البيانات التي جرى التقاطها في كثير من الأحيان مدخلا إلى نموذج العمليةء في حين‎ 
قد تكون بيانات‎ «JULI تكون البيانات المشتقة هي المخرج عن نموذج العملية. فعلى سبيل‎ 
الكثافة المرورية مدخلا إلى تموذج النقل والمواصلات على أن يكون المخرج هو بيانات التوقع‎ 
أو المحاكاة (مثل حساب حركة ال مرور المتوقعة في أوقات مختلفة أو في ظل ظروف مختلفة).‎ 
من المرجح أن تضم بيانات التعداد/ الكثافة ال مرورية مع بيانات‎ gigs ففي حال وجود‎ 
اخرى ملتقطة أو مشتقة (مثل نوع السيارةء وعدد الركاب... إلخ) لإنشاء بيانات مشتقة‎ 
إنتاج البيانات المشتقة لعدة أستباب» ما فيها‎ eus جديدة قد تشكل مدخلا للنموذج.‎ 
الحد من حجم البيانات والتقليل منها إلى قدر مقبول من الممكن إدارته لإنتاج مقاييس‎ 
أكثر فائدة وذات معنى. وف بعض الأحيانء قد تتم معالجة البيانات الأصلية الملتقطة إلى‎ 
مستويات مختلفة من الاشتقاق اعتمادا على الاستخدام المقصود. ويُعد نظام وكالة الفضاء‎ 
الأمريكية - ناسا الخاص برصد ومراقبة الأرض من الأمثلة على ذلك حيث يقدم بياناته في‎ 
ستة مستويات تبدأ من البيانات ال ملتقطة وغير المعالجة: وتمضى خلال درجات متزايدة‎ 
من مستويات المعالجة والتحليل وصولا إلى مخرجات النموذج القائمة على تحليل بيانات‎ 
.)١-۲ انظر جدول‎ ‘Borgman 2007) امستوى الأقل‎ 
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)١-7( الحدول‎ 


المستويات الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية 


- 


امستوى بيانات غير منظمة» pég‏ معالجة بالدقة الكاملة وبالحاله الخام $9239( 
كافه إضافات انات الاتصالات (على سل JLI‏ انات التزامن» 
ترودسه الاتصال» السانات (öy SL‏ 

المستوى الأول أ يانات فو متظع ف وقي AOE dodo‏ الكاملة: ولكن Lola dis:xo‏ 
ومذئّلة 9l‏ متبوعة بشروحات Sll‏ تشمل معاملات معايرة ومقاسس 
راديوية وجغرافيه ومؤشرات تحتسب وتضاف OLLU‏ في ال مستوى ٠‏ 
ولكن لا تطبق عليها. 


mM UT 


متغيرات dizio ASL Ss‏ بنفس 435 وموقع مصدر Oblo‏ امستوى 
الأول 








ا مستوى الثالث متغيرات تم تعيينها في مقاييس شبكة منتظمة للفراغ - الزمنء في 
العادة مع بعض المكملات والتدقيق على سلامتها 





المستوى الرابع مخرج النموذج أو النتائج من التحليل لبيانات المستويات الأقل 


ol REI)‏ مشتقة من قياسات متعددة). 





المصدر: مقتبس من الموقع الإلكتروني على العنوان : 


https://earthdata.nasa.gov/data/standards-and-references/processing-levels 
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(Secondary Data) السانات الثانوية‎ (Primary Data) 4.5! السانات‎ 
: (Tertiary Data) والسيانات العامة‎ 

يتم إنتاج البيانات à 5 JI‏ (الأساسية) من قبل الباحثين وأدواتهم من خلال تصاميم 
البحوث التي يضعونها. أما البيانات الثانوية فهي البيانات التي يتم إنشاؤها من قبل 
شخص ثم تتاح للآخرين لإعادة استخدامها وتحليلها. وعلى ذلكء ممكن أن تكون البيانات 
الأساسرة لشخص ما هي سانات ثانوية عند شخص آخر. أما البيانات العامة فهي شكل من 
أشكال السانات المشتقة»ء Js‏ التعدادء والفئات» والنتائج الإحصائية. وتصدر البيانات العامة 
غالبا من قبل الوكالات الإحصائية بدلا من البيانات الثانوية لضمان السرية للأشخاص 
الذين تشير إليهم هذه البيانات. على سبل «JU‏ يحظر نشر البيانات الأساسية للتعداد 
a3 Ul‏ الأيرلندي على أنها بيانات ثانوية إلا بعد مائة عام من إنتاجها؛ ولكن يتم الإفراج 
عن البيانات على صورة ملخصات إجمالية وبيانات تصنيفية عامة. ويسعى العديد من 
الباحثين والمؤسساتالإنتاج البيانات الأساسية لأنها مصممة Lapas‏ لاحتياجاتهم الخاصة 
ومركز عليهاء في حين لآ تتوفر خيارات التضميم هذه لأولئك الذين يقومون على تحليل 
السيانات الثانوية او العامة. وعلاوة على ذلك. على اولئك الذين يستخدمون السانات 
الثانوية والعامة كمدخلات في دراساتهم الخاصة أن يتوثقوا من صلاحية البحث الأصلى 
وصحته. 

ويجمع الباحثون في كثير من الأحيان بين البيانات الأساسية والبيانات الثانوية والعامة 
لإنتاج بيانات مشتقة ذات قيمة أكبر. على سبيل «JULI‏ قد تسعى متاجر التجزئة لإنشاء 
مجموعة بيانات مشتقة تدمج بيانات مبيعات الأساسية مع البيانات السكانية الجغرافية 
العامة (Tertiary geodemographics data)‏ وهی بيانات عن أي نوع من الناس الذين 
يعيشون ف مناطق مختلفة وا لملستمدة من التعداد السكاني والبيانات العامة والتجارية 
الأخرى من أجل تحديد أماكن لاستهدافها با مواد التسويقية. إن البيانات الثانوية والعامة 
ذات قيمة لأنها تمكن من اجراء الدراسات التكرارية وبناء مجموعات سانات SÍ‏ ديا 
وأكثر ثراء وتعقيدا. وهي تنتج لاحقا مأ أطلق عليه )2012 (Crampton et al.‏ مصطلح 
تضخيم البيانات (Data Amplification)‏ والذي يعني أن الجمع بين البيانات يتيح رؤى 
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تصور essa‏ البيانات 


أكبر بكثير من خلال الكشف عن الروابطء العلاقات» والأماط التي تبقى خافية في حال 
ظلت السانات معزولةء 42239 U‏ فإن سانات السوق الثانوية والعامة هي صناعة 
مليارات الدولارات (انظر الفصل (Y‏ 


السانات التأشيرية «(Indexical Data)‏ السانات الخاصية (Attribute Data)‏ 
والسانات الوصفية :(Metadata)‏ 

تختلف البيانات أيضا في gs I‏ فالبيانات التأشيرية هي تلك البيانات التي تتيح 
التعريف بالبيانات وربطها بغيرها من البيانات الأخرى: وتشمل معرّفات فريدة من نوعهاء 
مثل أرقام جوازات السفر وبطاقات الضمان الاجتماعيء وأرقام بطاقات الائتمانء والأرقام 
التسلسلية ال مصنعة.ء ومعرفات الكائن الرقميء. وعناوين الربط الشبي (IP and MAC)‏ 
وأرقام الشحن وطلبات الشراء» إضافة إلى الأسماءء والعناوين» والرموز البريدية. إن البيانات 
التأشيرية مهمة لأنها تساعد في حضر كميات كبيرة من البيانات غير المفهرسة بعضها مع 
بعض وتتبعها من خلال معرّفات AS iin‏ والمساعدة على التمييز بينهاء وضمهاء وتقسيمها 
وإعادة تجميعهاء والبحث فيها وغيرها من أشكال المعالجة والتحليل. وكما هو مبين في 
الفصل (aol JI‏ فقد أضحت البيانات التأشيرية شائعة على نحو متزايد وبصورة متخصصة 
مما يزيد من درجة الارتباط والعلائقية بين مجموعات السانات. آما البيانات الخاصية 
فهي بيانات تمثل جوانب من الظاهرةء ولكنها ليست تأشيرية بطبيعتهاء وعلى سبيل «JULI‏ 
بالنسبة إلى شخص ماء قد تكون البيانات التأشيرية هي بصمات الأصابع أو تسلسل الحمض 
النووي (DNA)‏ وقد تكون بيانات الخاصية له مثل العمرء الجنسء الطول» الوزن» لون 
العينينء فصيلة الدم: وغيرها. مع ملاحظة أن الغالبية العظمى من البيانات التي يتم 
إنشاؤها وتخزينها في الأنظمة هي بيانات الخاصية. 

البيانات الوصفية هي بيانات عن البيانات» ويمكن أن تشر البيانات الوصفية إلى 
محتوى السانات أو مجموعة البيانات كاملة. وقد تشمل البيانات الوصفية عن ال محتوى 
أسماء ووصف حقول بيانات محددة على سبيل «JULI‏ رؤوس الأعمدة في جدول البيانات 
وتعريفات البيانات. وتساعد هذه البيانات الوصفية مستخدم مجموعة البيانات على 
eas‏ مكونات البيانات وتركيبتها وكيف ينبغي استخدامها وتفسيرهاء وتساعد في الدمج بين 


859 البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها vv‏ 
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الفصل الأول 


مجموعات البيانات» وقابلية التشغيل البينى وتبادل البيانات بينهاء والاكتشاف» والقدرة 
على الحكم على مصدر البيانات وسندها. أما البيانات الوصفية التي تشير إلى مجموعة 
السانات كلها فلها ثلاثة أشكال )2004 .(NISO‏ فالشكل الأول يتعلق بالبيانات الوصفية 
التوضيحية والتي تشير إلى بيانات التحديد/التعريف والاكتشاف المتعلقة مجموعة 
البيانات» وتشمل عناصر مثل الاسم. وامؤلفء والناشرء والموضوع.: والوصف. ويتضمن 
الشكل الثاني البيانات الوصفية الهيكلية والتي تشير إلى بيانات التنظيم والتغطية لمجموعة 
البيانات. ويحتوي الشكل الثالث البيانات الوصفية الإدارية التي تعكس متى وكيف تم 
إنشاء مجموعة البيانات» وتفاصيل الجوانب الفنية للبيانات» مثل صيغة تنسيق املف 
ومن الذي ملك وله صلاحية استخدام البيانات. ومن المعايير الشائعة للبيانات الوصفية 
والذي يجمع الأنواع الثلاثة للبيانات الوصفية معيار دبلن كور Dublin Core) (http://)‏ 
.(dublincore.org‏ ويشترط هذا المعيار تمتع مجموعة البيانات بخمسة عشر حقلا 
للبيانات الوصفية هي : العنوان. ال منشىء» الموضوع: الوصف» الناشرء المساهم. التاريخ 
dg all «e 9l‏ المعرّف» المصدرء واللغةء العلاقةء التغطية / النطاق» والحقوق / الصلاحيات. 
وبرغم أن السيانات الوضفية تعد ao]‏ اكات à LIT‏ لكافة مجموغات البيانات: إلى 
أنه يجري إهمالها في ممارسات دعم الإتاحة وإعادة الاستخدام والمشاركة للبيانات Data)‏ 
Tm (Curation‏ من الباحثين الذين يجمعون البيانات الأساسية لاستخدامهم الخاص 
دون مشاركة الاخرين بها. 


(Knowledge) والمعرفة‎ (Information) والمعلومات‎ (Data) السسانات‎ 
(Wisdom) والحكمة‎ 

ما يوحد الأنواع ال مختلفة من البيانات التي تم التطرق إليها في الأجزاء السابقة هو 
أنها تشكل القاعدة أو الأساس الذي يقوم عليه هرم المعرفة: فالبيانات تسبق ال معلومات. 
وامعلومات تسبق امعرفة. والمعرفة تسبق الفهم والحكمة Adler 1986; Weinberger)‏ 
1). وتتميز كل dib‏ من الهرم من خلال عملية التقطير (التقليلء التلخيص والتجريد؛ 
المعالجة والتجهيزء التنظيم» التحليل» التفسيرء والتطبيق) التي تضيف التنظيم» المعنى: 
والقيمة من خلال الكشف عن العلاقات والحقائق حول العام (انظر الشكل .)١-١‏ 


rt‏ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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تصور لمفهوم البيانات 


وفي حين أن ترتيب ال مفاهيم داخل الهرم هو لا جدال فيه على العموم» إلا أن طبيعة 
المفاهيم والاختلافات بينها كثيرا ما تختلف بين المدارس الفكرية. فالمعلومات: على سبيل 
المثال» هي المفهوم الذي يفهم على نحو مختلف بين cells]‏ فبالنسبة للبعض, ا معلومات 
هي تراكم البيانات ا مرتبطة بهاء وبالنسبة للآخرين هي البيانات إضافة للمعنىء أو الإشارة 
ذات المعنى في ضوضاء البيانات» أو البناء متعدد الأوجه» أو البيانات العامة حيث تم 
إعادة صياغة البيانات الأساسية من خلال نموذج تحليلى. فبالنسبة لعا الفيزياء البيانات 
هي مجرد سلسلة من الأصفار والآحاد. أي tel (Bits)‏ وتعد ضوضاء .(Noise)‏ ولذلك 
فإن ال معلومات بالنسبه لعام الفيزياء تتكون عندما يتم تنظيم هذه الأعداد من الصفر 
والواحد 3 أنماط متميزة؛ فهذه هى الإشارة المفيدة )2003 .(von Baeyer‏ فموجات 
الأثير وكابلات الاتصالات هي ممتلئة بال معلومات المتدفقة - كإشارات الراديو والتلفاز 
والمحادثات الهاتفية وحزم بيانات شبكة الانترنت - التي تعني bli‏ ذات مغزى من 
البيانات ضمن خزمة أوسع من الضوضاء. وبالنسبة 55,5( فال معلومات ذات مفهوم 
أوسع. فقد 332 )74 :2010 (Floridi‏ على سبيل «Jb!‏ ثلاثة أنواع من المعلومات : 
o‏ الواقعبة :(Factual)‏ معلومات تعكس الحقيقة (على سبل bY «JULI‏ بصمات 

ale‏ وحلقات جذوع الأشجار). 


e‏ التعليمية :(Instrucional)‏ معلومات لأجل الحقيقة (Ae)‏ سبل المثال: الأوامن 
«Las lal‏ والوصفات). 


o‏ الدلالية :(Semantic)‏ معلومات عن الحقيقة (Ae)‏ سل «JULI‏ الحداول الزمنية 
للقطارات» الخرائطء والسير الذاتية). 


ثورة البيانات البيانات الكبيرةء والبيانات اممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها Yo‏ 
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الفصل الأول 


شكل )١-١(‏ 
هرم المعرفة (منقول من 2010 (Adler 1986 and McCandless‏ 





المعرفة 
التحليل التفسير معلومات منظمة 
المعلومات 
M pm‏ عناصر مرتبطة 


السانات 


التقليص التجريد فاه ا 


فالنوع الأول هو أساسا بيانات ذات معنى» وهو ما يطلق عليه عادة الحقائق. وهي 
البيانقات التي يتم تنظيمها وتركيبها ضمن نظام قياس أو مرجع خارجي يوفر يطبيعته 
أساسا لإنشاء ال معنى الأول الذي يحمل بعض الحقيقة. وتمتد ال معلومات أيضا إلى ما 
بعد البيانات والحقائق من خلال إضافة قيمة تساعد على التفسير. «Ales‏ أوضح 
(Weinberger 2011: 2)‏ أن : "المعلومات بالنسبة للساناتء كالنسيذ بالنسبة لحقل 
العنب: استخراج نواتج التقطير اللذيذة! ". ولذا مكن الحصول على هذه القيمة من 
خلال فرز» وتصنيف» وربطء وإضافة المحتوى الدلالي من خلال بعض الشكل النصي أو 
الصوري والذي يشير إلى شيء ما و/ أو يرشد إلى ما ينبغي القيام به (على سبيل «JU‏ 
الإشارة الضوئية التحذيرية على dag)‏ معلومات مؤشرات عمل السيارة التي تشير إلى 
فراغ البطارية وحاجتها لإعادة الشحنء 2010 (Floridi,‏ وقد gu‏ (2002: ملخصا في 
Borgman 2007: 40) Case‏ أن الاختلافات في تعريف ال معلومات تتوقف على خمس 
NUM‏ 


1" ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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عدم اليقين (Uncertainty)‏ أو ما ISl‏ كان شىء ما قد يحد من عدم اليقين 
في تأهيل البيانات لتكون معلومات؛ المادية ((Physicality)‏ أو ما إذا كان 
شيء ينبغي أن يؤخذ على شكل مادي مثل «OUS‏ أو 5355« أو موجات صوتية 
لكلمة خطيب لتأهل البيانات لتكون معلومات؛ البنية / العملية Structure/)‏ 
(Process‏ أو ما إذا كان يلزم مجموعة من الترتيبات أو العلاقات؛ القصد والعزيمة 
(Intentionality)‏ أو ما اذا كان شخص ما قد أوعز Ob‏ شيئا ما تم التواصل معه 
ليتأهل ليكون معلومات؛ والحقيقة (Truth)‏ أو ما إذا كان ينبغي أن يكون 
الشيء منیا dalli‏ کون وخا 
وبغض النظر عن كيفية تصور US‏ فقد لاحظ )2010 (Floridi‏ آنه بالنظر إلى إضافة 
المعلومات المعنى إلى البيانات» فهي تكتسب القيمة الربحية كسلعة» غير أنهاء كنوع متميز 
من السلعء تمتلك ثلاثة خصائص رئيسية مميزة (والتي تتميز بها البيانات أيضا): 
غير تنافسية ) :(Non-rivalrous‏ حيث من الممكن لأكثر من مستخدم أن متلك نفس 
المعلومات دون التأثير على مذى استفادة المستخدمين الآخرين منها (على عكس السلع 
امادية المستهلكة). 
غير قابلة للاستثناء أو الإقصاء :(Non-excludable)‏ حيث يتم تقاسمها ومشاركتها 
بسهولة ويلزم بذل جهد كبير في السعي للحد من Jio‏ هذه ال مشاركة (مثل فرض اتفاقيات 
حقوق الملكية الفكرية أو إضافة حواجز الدفع (Paywalls)‏ قبل الاستخدام). 
التكلفة الهامشبة :(Zero Marginal Cost)‏ مجرد إتاحة المعلومات من اطرة الأولىء 
فإن تكلفة الاستنساخ أو إعادة الإنتاج في كثير من الأحيان لا تكاد تذكر. 
ومع التنديد على خصائص كون ال معلومات مورد يتميز بعدم ال منازعة وعدم الاستثناء 
ولأ اللهلومات قسن اها dao‏ تسكن dads]‏ من ا الكناقات soa‏ والحد من قذاولها 
والسيطرة عليها ومن ثم زيادة قيمتها. ومعظم هذه القيمة تضاف من خلال العمليات 
التي تفرض خلال دورة حياة ال معلومات )2010 (Floridi‏ والمشتملة على المراحل التالية: 
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الوجود (Occurrence)‏ الاكتشافء التصميم» التأليف. 
الإرسال «LZ! :(Transmission)‏ التوزيع: النفاذ. الاسترجاع. النقل. 


امعالجة والإدارة :(Processing and Management)‏ الجمع. التحقق. التعديل» 
التنظيم؛ الفرزء التصنيف». التصفية؛ «oA‏ التخزين. 

الاستخدام (Usage)‏ الرصد وامراقبة: النمذجة. التحليلء الشرح. التخطيط ail‏ 
اتخاذ القرارات» التوجيه» التعليم» التعلم. 

ومن خلال ال معالجة والإدارة والاستخدام يتم تحويل ال معلومات إلى معرفة أكثر قيمة. 


وكما هو الحال مع جميع ال مفاهيم في هرم di xA‏ وبامثلء يختلف فهم مفهوم 
المعرفة. فبالنسبة للبعضء المعرفة هى الدراية التى تحول ال معلومات إلى تعليمات 
.(Weinberger 2011: 3)‏ فعلى سبيل «JUL‏ مكن ربط المعلومات الدلالية إلى وصفات 
وتعليمات (أولا قم das‏ ثكم افعل ذلك..) أو نموذج شرظى لإجراءات استنتاجية (إذا 
كان الحال هو كذا وكذا فافعل JIS‏ وإلا افعل هذا) )2010 .(Floridi‏ فى هذا التأطير. 
تكون المعلومات هي البيانات JI‏ 445« وال معرفة هي معلومات إجرائية قابله للتنفيذ 
(Weinberger 2011)‏ وبعبارة أخرىء "المعرفة هي الوصفة التي Jas‏ ال معلومات 
إلى الخبز القابل للأكلء بينما البيانات هى العناصر المكونة للدقيق والخميرة' Zelany)‏ 
1987 منقول عن 2011 .(Weinberger‏ وبالنسة للآخرين؛ فإن امعرفة هي X51‏ کی 
مجرد مجموعة من التعليمات ؛ ويمكن أن تكون المهارات العمليةء وأبعد بكثير عن مجرد 
وسيلة لمعرفة LAS‏ إجراء أو تحقيق المهمة: أو النظام الفكري الذي يربط بشكل متسق 
ا معلومات مع بعضها البعض للكشف عن صورة أوسع لظاهرة ما. وينطوي إيجاد 
المعرفة على تطبيق العمليات المعرفية المعقدة على المعلومات مثل الإدراك: والجمع 
والتركيب» والاستخلاص. والدمج والتكوين؛ والاستنتاج والربط. وللمعرفة قيمة أكبر من 
قيمة المعلومات لأنها توفر أساسا لفهم» وتوضيح. ورسم رؤى حول bll‏ والتى من 
الممكن استخدامها في صياغة السياسات والإجراءات. أما الحكمة» التي تحتل قمة هرم 
sl‏ ,45( فهي القدرة على تطبيق ال معرفة برجاحة وروية. 


YA‏ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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وبرغم أنه م (Lal‏ بثبات علاقة كل أشكال المعرفة بالبيانات» على سبيل JELI‏ التخمين 
والآراء والمعتقدات» إلا أن البيانات تشكل بوضوح مادة القاعدة الرئيسية LASI‏ استشعار 
الواقع والعالم من حولنا. حيث تشكل البيانات المدخلات الأساسية في العمليات مثل 
الجمع» الفرزء التصنيف» المطابقةء التشخيص / التنميطء والنمذجة التي تسعى إلى إنشاء 
المعلومات والمعرفة من أجل فهم الظواهرء والتنبؤ بها وضبطها والسيطرة عليها. كما 
يمكننا إنتاج البيانات بمرور الوقت وف أماكن مختلفة من qui‏ وتقييم» ومقارنة الظواهر 
عبر الأزمنة والأماكن والنطاقات. وهكذاء deg‏ الرغم من أنه ينظر إلى المعلومات وا معرفة 
إلى كونها مفاهيم ذات do)»‏ أغلى وقيمة أك تبقى البيانات: مع ذلك: عنصرا أساسيا مع 
قيمة كامنه كبيرة يجرى إدراكها وتحصيلها عند تحويلها إلى معلومات ومعارف. فالدافع 
المنطقي الرئيسي لخركة البيانات المفتوحة. والتي بحثت في الفصل الثالث: هو القدرة على 
الوصول إلى القيمة الكامنة في مجموعات بيانات القطاعات الإدارية والعامة. 


تأطير البيانات (Framing Data)‏ 
حتى الآن في هذا الفصلء فقد colo‏ بالفعل صياغة البيانات من الناحية النظرية من حيث 
مناقشة أنطولوجيا البيانات (ماهية وجودها)ء وأشكالها المختلفة. وأين تتموضع داخل هرم 
ا معرفة. كما أن هناك عددا لا يخصى من lll‏ الأخرى التي يمكن بها فهم البيانات والتفكير 
بها على سبيل JULI‏ من المنظور التقني الخاص بجودة البيانات» وصحتهاء وموثوقيتهاء 
ونسبتهاء وقابليتها للاستخدام» وكيف Sce‏ معالجتها وتنظيمهاء وتقاسمهاء وتحليلها؛ أو 
من ال منظور الأخلاقي المتعلق بالأسباب التي دفعت إلى إنتاج البيانات والاستخدامات التي 
يتم توظيفها بها؛ أو من المنظور السياسي أو الاقتصادي والذي يأخذ بعين الاعتبار التصور 
المعياري للبيانات ومواضع الطعن والتنازع والتنافس فيها كمنفعة عامة» ورأس مال سياسي, 
وملكية فكرية» أو سلعة تجاريةء وكيف يتم تنظيمها وتداولها؛ أو من ال منظور المكاني و/ أو 
الزماني المتعلق بكيفية إنتاج البيانات وتطوير استخداماتها ومحاور تركيزها من قبل الأنظمة 
والمجموعات التقنية: والأخلاقيةء والسياسيةء والاقتصادية عبر الممكان والزمان؛ أو من المنظور 
الفلسفي الذي يأخذ بعين الاعتبار المفاهيم المبدئية وا معرفية للبيانات. وسنرجع لاستذكار 

العديد من القضاياء التي تم بحثها في هذا القسم» لاحقا في جميع أجزاء الكتاب المقبلة. 
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المنظور الفني :(Technically)‏ 

في جميع التخصصات. يتم أخذ البيانات بعين الاعتبار من وجهة النظر التقنية ال معيارية. 
والسؤال المطروح على المحك هو إلى أي مدى تنتج طرق التقاط البيانات وقياسها بيانات 
محددة» ونظيفة؛ 42,359( وكيف مکن وينبغي معالجه» وتنظيم. ومشاركة. وتحليل هذه 
السانات بطرق تحافظ على سلامتها. من أجل ضمان موثوقيتها وصلاحية الاستنتاجات 
ا مستخلصة منها. ولذا كان هنالك Llo‏ شكوك فيما يتعلق بصحة السانات لأنها بطبيعتها 
محردة. وعمومية: وتقرسة عند إنتاجها )2009 US Cus .(Goodchild‏ فقد 4293 
الكثير من الاهتمام إلى قضايا تتعلق ممفاهيم تمثيل البيانات (Data representativeness)‏ 
وعدم (Jl‏ بصحتها (Uncertainty)‏ ودرجة الموثوقية بها (Reliability)‏ والأخطاء 
اممكنة المصاحبة لها (Error)‏ والتحيز ا منتقص مصداقية دلالاتها (Bias)‏ وا معايرة 
(Calibration)‏ في تصميم البحوث وتطبيقاتها. وتسجيل هذه ال معلومات كبيانات وصفية. 

وبالنظر للبيانات على أنها علامة بديلة عن بعض جوانب ظاهرة ما - كالضوء هثل نجما. 
والخصائص الفيزيائية التي تمثل مبنى» والكلمات التي تمثل أفكار شخص - يتعلق التمثيل 
sas (Representativeness)‏ التقاط البيانات لهذه الظاهرة التي تسعى إلى تمثيلهاء dis‏ 
أي مدى تمثل عينة البيانات التي تم إنشاؤها المجتمع الكامل للظاهرة. وفيما يتعلق 
بالسؤال السابقء فإن السؤال الرئيسي هو إلى آي مدى يمكن أن نكون على ثقة من أن 
التقنيات العلمية قد التقطت بدقة الظاهرة قبد الدراسة. لقد مثل هذا التساؤل مشكلة 
خاصة في مجال العلوم الاجتماعية والإنسانية وآثبت أنه كان من الصعب حلها. فعلى 
سبيل JEM‏ لوحظ بشكل كبير أن ما يقول الناس أنهم سيفعلون وما يفعلونه في الغالب 
ما يكون مختلفا تماما عن الواقع» وما alei‏ الناس في كثير من الأحيان قد لا يقصدونه. 
ولذلك برز سؤال حول المدى الذي تمثله بيانات ALEL‏ الشخصية للسلوك Gdl‏ أو 
مدى تمشل الفكر الواعي لهم. (bs‏ هناك مخاوف Ou‏ مدى التقاط وتمثيل المؤشرات 
الرئيسية للتعبير بدرجة كافية عن كيفية أداء مجال ما. على سبيل JEU‏ إلى أي مدى 
تعطي المؤشرات المتعلقة بعدد مرات الاقتباس» ومؤشر إتش (H-index)‏ وبراءات الاختراع 
المسجلة دلالة على أداء عالي الجودة من قبل موظفي الجامعة (مع الاحترام لأعضاء هيئة 
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التدريس في مجال العلوم الإنسانية فإن هذه المؤشرات تعد سيئة للغاية)؟ ولذا كان الحل في 
محاولة تطوير تصاميم بحثية أكثر تعقيدا لمواجهة أوجه القصور ف هذه الأساليب المختلفة, 
أو تجاهل أوجه القصور المتعلقة بها إلى حد كبير. 

وبالنسبة لما يتعلق بمدى تمثيل عينة لمجتمع دراسة do‏ فقد نقرر, اعتمادا على خمسين 
daz‏ إنتاج بيانات فلكية dla‏ ومفصّلة. وعلى مدى طويل من أجل فهم أفضل 
لطبيعتها. ولكن إلى أي مدى يمكن أن نكون على ثقة بأن هذه الخمسين نجمة تمثل مجمل 
خصائص المليارات الأخرى من النجوم الموجودة؟ وحتى في عصر البيانات الكبيرة» التي 
تسعى إلى أن تكون شاملة وليست انتقائية في إنتاج البيانات (انظر الفصل الرابع)ء فإن 
البيانات هي بطبيعتها ius‏ (فليس كل الناس يستخدمون وسائل التواصل الاجتماعيء أو 
يتسوقون باستخدام البطاقات الائتمانية» وبالتأكيد لا يمتلك كثير من الناس في جميع أنحاء 
العام حق الوصول إلى الهواتف وأجهزة الحاسب)ء وهذا يعني أن البيانات هي ممثلة 
do erc‏ من CIT‏ ودی کیک 5 کیو ipao. ac. ORO oa!‏ افر کا الحل هو 
jS‏ مجموعة من تقنيات أخذ العينات التي تسعى إلى ضمان التمثيل الدقيق في ظل 
مختلف الظروف lg)‏ تعتمد غالبا على عينة عشوائية). واستحداث أساليب إحصائية 
تقوم بحساب مدى الثقة التي يمكننا أن نكون عليها JLo‏ تمثيل عينة ما gaiak‏ الدراسة 
(Kitchin and Tate 1999)‏ 

وتتعلق الموثوقية بالتكرارية أو الاتساق في الحصول على النتيجة نفسها من توظيف 
à JI‏ البحث. وقد وصف )1997 (Golledge and Stimson‏ ثلانة أنواع من اطوثوقبة: 
(Y)‏ ا موثوقية التَصَوريّة (quixotic reliability)‏ حيث تؤدي طريقة واحدة للملاحظة 
والاستكشاف إلى WT‏ غير متغير باستمرار. (Y)‏ اطوثوقية الزمنية المتعاقبة Diachronic)‏ 
(Reliability‏ وفيها يكون استقرار الملاحظات عر الزمن. (Y)‏ الموثوقية التزامنية 
(Synchronic Reliability)‏ وفيها يكون التشابه في الملاحظات خلال الفترة الزمنية نفسها. 
وتعد الموثوقية مهمة لأنه من ghabl‏ به أنه كلما كان القياس أكثر اتساقا في إنتاج البيانات» 
أمكن بشكل SÍ‏ وصف هذه البيانات بأنها بيانات موثوقة. 
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والخطأ هو الفرق بين القيمة المقاسة والقيمة الحقيقية» ويمكن أن يشمل الغيابات 
البيانات اط مفقودةء والأخطاء مثل الخطأ في الإدخال / الترميز أو الخطأ في التصنيف أو سوء 
تطبيق الأسلوب التقني» وسوء الفهم. آما التحيز فهو نوع معين من dhal‏ حيث تنحرف 
Jae ca uo OLLI‏ ثابت من الخطأ. وعادة ما يحدث التحيز بسي الطريقة: أو SII‏ 
أو أسلوب أخذ العينات المستخدم لإنشاء البيانات والتي لها تأثير مفرط على البيانات التي 
يتم إنتاجهاء أو يمكن تقدهها بسبب موقف إيديولوجي أو تطلعات الباحث في كثير من 
الأحيان بطريقة غير متعمدة )1996 .(Kitchin‏ ومن الممكن أن تتسبب آليات ال معالجة 
مثل التجميع أو الإجمال في إحداث تحيز من خلال الحد من التباين في مجموعة البيانات 
مما )$35 إلى أخطاء المغالطة المنطقية للاستدلال البيئي (Ecological Fallacy Errrors)‏ 
معنى أنه على افتراض Lg‏ القيمة الإجماليه مجموع الأفراد بدقة على SI JULI Loc‏ 
كان لدينا اشتخصین وزنهما O*‏ كيلوجراما وآخرين وزنهما ۱۵۰ كيلوجراما فشیکون متوسط 
الوزن الإجمالي هو١ ٠١‏ كيلوجرام» ولكن لا أحد في المجموعة يزن هذا الوزن في الواقع 
.(Kitchin and Fotheringham 1997)‏ ويتعلق مفهوم عدم اليقين مدى ثقة الباحث 
بخصوص دقة البيانات وأي تحليل قائم على أساسها. أما فيما يتعلق بالبيانات الكمية, 
فيتصل بدرجة اليقين بالاختبار الإحصائي وذلك بالنظر إلى البيانات اممدخلةء وعادة تحتسب 
على أساس الاحتمالات ويُعبّر lie‏ مستويات الثقة )2009 .(Goodchild‏ أما مفهوم عدم 
اليقين بالنسبة للبيانات النوعية. فيجري في الغالب تقييمه والحكم عليه من قبل خبير slo‏ 
على الخيرة السابقة. 

وتتمثل دعائم معالجة هذه ال مخاوف بالإهان ob‏ مثل هذه القضايا تنشأ بسبب الضعف 
البشري في تصميم البحث أو أوجه القصور وعدم كفاءة الأدوات والمعدات أو الطرق 
المستخدمة والتي من ال ممكن التغلب عليها من خلال الحلول التقنية. وهذا يعني أنه من 
الممكن معالجتها عن طريق تحسين نوعية الإجراءات وال معدات المستخدمة»ء وتطبيق أنظمة 
التوحيد القياسي (التقييس - (Standardization‏ والتي توفر معايير جودة البيانات sl‏ 4$9 
مشل تلك التى أقرتها المنظمة الدولية للمعايير آيزو (ISO)‏ والتي تعمل على إيجاد سبل 
للتعويض عن عدم اليقين والخطأ والتحيز في وسائل التحليل المستخدمة. 
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المنظور الأخلاقي (Ethically)‏ 

الأخلاق معنيّة بالفكر والممارسة المتعلقة بمفاهيم القيم مثل العدالةء والمساواة. 
والنزاهة: والصدق» «el x2 ls‏ والحقوق» والواجبات» والرعاية. dawg‏ كل مجتمع وفق 
مزيج من القيم الأخلاقية الفطرية البديهية والعامية غير الرسمية: المسلم بهاء والمواقف 
الأخلاقية المقنتّة جيدا le o sails‏ في قواعد. ومبادئ. وسياسات» وتراخيصء وقوانين 
تخضع SLAN‏ من قبل أجهزة الدولة والوكالات الأخرى. وكثيرا ما تكون هذه المواقف 
الأخلاقية محل نزاع بين مجموعات مختلفة تأخذ وجهات نظر متناقضة عن القيم نفسها 
ls‏ أي مدى ينبغي إخضاع المواقف الأخلاقية للتشريع القانوني» ومناقشتها كممارسة في 
الفلسفة الأخلاقية. كما يوجد dis‏ هذا الطعن فيما يتعلق بالبيانات» وخاصة ما يتعلق Le‏ 
يتم إنشاؤه من بيانات ووسائل الإنتاج لهاء وكيفية مشاركة البيانات وتقاسمهاء وتداولهاء 
وحمايتهاء وإلى الحدود التي ينتهى عندها العمل بها. 

ففي حينء تعد بعض البيانات معتدلة نسبياء على سبيل JUL‏ القياسات المتعلقة 
بالطقسء فإن بعض البيانات الأخرى تعد حساسة للغاية» كالبيانات المتعلقة ASYL‏ والتى 
مكن استخدامها لإنتاج صورة مفصلة عن الحياة ال معيشية (ea)‏ وضبط وتنظيم تلك الحياة 
على إيقاع معين. وقد يلحق ell‏ البيانات ضررا في بعض الحالات» على سبيل JELI‏ 
الأضرار التي قد تنتج عن إجراء مقابلات مع ناجين من جرائم الحرب وما قد تتسبب 
فيه تلك المقابلات من ضغوطات نفسية وضيق. وف هذا المقام. هناك تساؤلات حول 
المدى الذى من الممكن أن يشكل فيه إنتاج البيانات. ومختلف أشكال المراقبة والترصد 
للسانات (Dataveillance)‏ أي امراقة والرصد من خلال dalea‏ وتحليل سجلات «LUI‏ 
وتحليل البيانات Éa‏ على الخصوصية وحقوق الإنسان الأخرى. وتساؤلات أيضاً حول 
المدى الذي يمكن أن تستخدم فيه هذه البيانات بفعالية لفرز الأفراد اجتماعيا بمعنى تقديم 
خدمات dla‏ على اسان خصائص الأفراد ا مميزة لهم )2005 (Graham‏ وتتعاظم 
هذه المخاوف بالنظر إلى سهولة جمع ومشاركة وتداول البيانات الرقمية» ونحن نعيش في 
pas‏ توليد البيانات ومراقبتها بصورة طاغية وعلى نطاق واسع. ولعله ليس من المستغرب 
بعد ذلك أن وكالات تمويل البحث العلمى ومؤسسات التعليم العالي الآن تقيّم بشكل $592 


ثورة السانات السانات الكبيرة: والسانات c> gåt l‏ والبنى التحشة للسانات» والنتائنج ا مترتة عنها ev‏ 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الأول 


الأبعاد الأخلاقية للمشاريع البحثية نظرا لآثارها المحتملة على نطاق أوسع وإضافة لذلك 
فقد سنت الدول تشريعات» Jis‏ قوانين حماية البيانات وقوانين الخصوصية: في محاولة gil‏ 
سوء الاستخدام والتجاوزات المسيئة للبيانات» ولقد تم مناقشة هذه المسائل وما يتصل بها 
بشكل مفصل ف الفصل العاشر. 


المنظور السياسي والاقتصادي :(Politically and Economically)‏ 
مثل الاهتمام بال منظور الأخلاقي للبيانات البداية للكشف عن الطرق التي تعمل على 
ybl‏ البيانات من خلال الاهتمامات السياسية والاقتصادية على نطاق أوسع. وتتعلق 
هذه الاهتمامات بماهية البيانات التي يتم إنشاؤهاء وكيفية معالجتهاء وتحليلهاء وتوظيفها 
بالنسبة إلى: كيفية تضور البيانات وتوصيفها معياريا ضمن المجموعات الشكانية وتوظيفها 
من قبل الدول» ومفاهيم الكيفية التي ينبغي بها تنظيم البيانات وتقنينها؛ والمناقشات التي 
تطرح ضمن مجموعات الاختصاص التي تؤيد أو تعارض إنتاج البيانات وتطبيقاتها؛ واتخاذ 
القرار حول التمويل والاستثمار في البيانات؛ وانتشار الرأسمالية والطرق التي تستخدم 
البيانات لإدارة المساعي وزيادة القيمة والأرباح؛ والتداول للبيانات كسلعة مع ظهور سوق 
للبيانات تقدر قيمته بمليارات الدولارات والتى يشارك فيها مجموعة متنوعة من اللاعبين 
كامنتجينء المجمّعين» البائعينء المحللين. والمستهلكينء انظر الفصل الثانى. فمنتجو البيانات 
ينبغي عليهم الأخذ بعين الاعتبار الرآي العام والسياسيء والاعتبارات الأخلاقية والبيئة 
التنظيمية والتمويل المتاح وسلامة استثماراتهم إزاء الموارد. كما ينبغي على أولئك القائمين 
على الساحتين التشريعية والتمويل YUI‏ أن يكون لديهم سعة الأفق واتخاذ القرارات حول 
كيفية تشكيل ال مشهد الذي يعمل به منتجو ومستخدمو البيانات» وكذلك النظر ف أنظمة 
العمل المتعلقة بالبيانات الخاصة بهم وما يكشفونه عن جداول أعمالهم وأولوياتهم 

وأساليب الإدارة والحوكمة الخاصة بهم )2012 (Lauriault‏ 

وف كلتا الحالتين» هناك مجموعة متنوعة من العلاقات السياسية والاقتصادية العقلانية 
في المشهد.ء مع أصوات متنافسة تسعى SEU‏ على الرأي ومشهد البيانات على النطاق 
الأوسع. فعلى سبيل JUL‏ فإن حركة البيانات المفتوحة تمثل البيانات كسلعة عامة تتشكل 
من العموم وتكون ف متناول الجميع بحرية مطلقة باستثناء البيانات الحساسة أمنياء 
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والشخصية الخاصة أو يمكن الوصول إليها من خلال اتفاقيات الاستخدام العادل. وفي 
المقابلء يعرض قطاع الأعمال البيانات كسلعة تجارية قيّمة تحتاج من جهة إلى الحماية 
من خلال أنظمة الملكية الفكرية (حقوق الطبع والنشرء براءات الاختراع» وحقوق ال ملكية) 
ولكن» من جهة أخرى لا ينبغي ربطها بشدة بالمحاذير الأخلاقية التي تمنع من استغلالها 
لتحقيق المكاسب AJU‏ أما بالنسبة للمجتمعات والدولء فالبيانات هي الوسائل التي 
مكن من خلالها تقنين» وممارسة. ومنازعة الأجندات السياسية والأعمال عبر تمكين بناء 
الإثباتات - أي الروايات المسندة والدعوات المضادة التي لها قيمة بلاغية أكبر من مجرد 
التندر أو دغدغه المشاعر )2013 õlg .(Wilson 2011; Garvey‏ 5,21« تعد السانات 
بالنسبة bll‏ الفلسفة الفرنسي 1981( (Foucault's‏ شكلا من أشكال السلطة / المعرفة؛ أي 
وسيلة مكن من خلالها Jaco‏ وتنظيم الشعوب» والظواهرء والأقاليم )2012 .(Lauriault‏ 
وتتقاطع هذه الاهتمامات وال مصالح البديلة في كثير من الأحيان بطرق متناقضة: من حيث 
أنه قد ossa‏ لها أجندات مختلفة تماماء على سبيل المثال دع الأعمال التجازية الكبيرة 
لحركة البيانات المفتوحة فما يتعلق بالسيانات العامة (انظر الفصل الثالث). وبعبارة 
أخرىء تظهر البيانات جليا وتتموضع ضمن الاقتضاذات السياسية المعقدة, وف الوقت 
نفسه فهى تستخدم لتشكيل Jio‏ هذه القضايا والنظم وال مجموعات. 

وعلاوة على ذلك. تشكل البيانات مورد bolal‏ وهي عنصر أساسي ف المرحلة ALAL‏ 
من الاقتصاد القائم على «d$,‏ وتعمل على إعادة تشكيل نمط الإنتاج القائم على البيانات 
(انظر الفصل السابع). ومنذ أواخر الثمانينيات (19805): يرى بعض العلماء مثل Castells‏ 
)1996 ,1988( أن آخر دورة للرأسمالية يدعمها إنتاج المعرفة التي تنشئ منتجات وأشكال 
عمالة جديدةء وتسهل إعادة الهيكلة الاقتصادية: وتعزز الإنتاجية والقدرة التنافسية: والكفاءة 
والاستدامة» وتراكم رأس المال. وتعد البيانات الكبيرةء على وجه «uos a]‏ هي أحدث 
التطورات المتعلقة بتعميق وتعزيز هذه الدورةء وتوفير ثورة من الأدلة التي يتم استخدامها 
من قبل الشركات من جهة. لرصد وتقييم أداء الشركة اللحظي» والحد من الهدر والاحتيالء 
وتحسين إستراتيجية الشركات» والتخطيط وصنع القرارء ومن جهة $55« لتصميم glo‏ جديدة 
وتحديد واستهداف أسواق جديدةء وتطبيق التسعر المتغيرء وإدراك الإمكانات غير ا مستغلة, 
واكتساب ميزة تنافسية )2012 (Manyika et al. 2011: Zikopoulos et al.‏ وق سبيل 
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القيام «Do‏ يمكن إنتاج وتحليل البيانات من تشغيل الشركات بشكل أكثر ذكاء فيما يتعلق 
بكيفية تنظيمها وتشغيلهاء وتعزيز المرونة والابتكارء والحد من ال مخاطر والتكاليف والخسائر 
التشغيليةء وتحسين تجربة العملاء. وتعظيم العائد من الاستثمار والأرباح. وكقائد لعملية 
تراكم راش «JUS‏ ستسهم البيانات الكبيرة في إيجاد أعمال (وظائف) جديدة وف الجولة ال مقبلة 
من التنمية غير المتوازنة» ومن هذا ا منظور يمكن فهم البيانات على أنها وكيل ممصالح رأس JUI‏ 
واهتماماته. 


المنظور الزماني والمكاني :(Temporally and Spatially)‏ 
تمتلك البيانات أبعادا زمانية ومكانية على حدّ سواء. حيث تختلف ماهية البيانات التي 
يتم إنتاجها والطرق التي يتم بها معالجتهاء وتحليلهاء وتخزينهاء أو التخلص منها باختلاف 
الزمان وال مكان؛ أي أن للبيانات ومجاميعها المحيطة بها دلالات تاريخية وجغرافية. كما 
تتغير كيفية معالجة البيانات وتحليلها مع مرور الوقت» متأثرة بالتغيرات والتحسينات 
التنظيمية فى التعذاد والإدارةء والقوانين الجديدة المتعلقة بتداول البيانات وحمايتهاء 
والتقنيات الجديدة. والطرق الجديدة في فرز البيانات وتحليلهاء والاختلافات الإحصائية 
الجغرافية Jis‏ حدود المقاطعة المحلية أو الوطنية الجديدة: والأسالي الإحصائية الجديدة. 
وعلاوة على ذلك» يمكن مجاميع البيانات التي تستخدم في ولاية معينة أن تكون مختلفة 
Lau‏ عن تلك التي تستخدم في 5,2« وحتى داخل حدود الولاية الواحدةء فقد تختلف 
الطريقة التي يقوم فيها كيان ما بإنتاج البيانات وإدارتها بسبب التقلبات المؤسسية أو 

الشخصدة. 


وبالنظر ف التعدادات السكانية» يتكون التعداد من مسح شامل طنطقة وساكنيهاء 
ويتم إجراء المسح ف العادة كل عشر سنواتء والهدف من ذلك هو جمع معلومات 
اساسية حول المقيمين في منطقة ما وخصائصهم على سبيل «JULI‏ العمرء الجنس» الحالة 
الاجتماعية: التركيبة الأسريةء الدينء العرقء الطبقة الاجتماعيةء وما إلى ذلك وجوانب 
عيشهم فيها (عملهم» ومكان الإقامة. وما إلى ذلك). ويتطلب تمكين قياس التغيير في 
التعدادات السكانية الاستمرارية فيما يتعلق بالأسئلة المطروحة فيها والكيفية التي تدار 
بها هذه التعدادات. وف ذات الوقت» يتطلب التقاط البيانات الجديدة موضع الاهتمام 
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تصور لمفهوم البيانات 


والتى تعكس تغيرات أوسع ف المجتمع: إجراء تغييرات على آلية هذه التعدادات» مثل 
إضافة أستلة جديدة أو التعديل على الأستلة الأساسية (انظر الشكل :V-Y‏ ولاحظ كيف أنه 
حتى عندما تم م الحفاظ على الأسئلة عبر التعدادات السكانية المتعاقبة؛ فإن ALAS‏ صباغتها 
كانت غالبا ما تكون مختلفة تماما في كل مرة). وعلاوة على eUS‏ فإن الكيفية التي 
يدار بها التعداد als JI‏ كانت JS i‏ في التعدادات المتعاقبة من قبل قوى مؤسسية: 
وسياسية: واقتصادية: وتطورات 35 4 جديدة : انظر 1991( (Linehan‏ للتعرف على 
تاريخ التعداد السكانى الايرلندي من (Lauriault (20125 «343 Y - VAYY‏ لتحليل التعداد 
الكندى من .V«YY - ۱۸۷١‏ علاوة على «US‏ يتعرض التعداد للطعن والتفاوض Ca‏ 
تتنافس مصالح خاصة qua)‏ أو تغييرء أو إزالة الأسئلة منها. وف بعض الحالاتء مكن أن 
تكون التغييرات المطلوبة جذرية بشكل متطرف» مثل القرار GUII‏ بوقف إجراء التعداد 
السكاني في الثمانينات (انظر 2011 dasg (Hannah‏ لذلك» يرزح التعداد الوطنى دائما 
تحت وطأة التوتر الناتج عن الاستمرارية والتغيير» ومع ذلك: يتطور مع مرور الوقت وفي 
مناطق جغرافة مختلفة. وحتى YI‏ ومع eUS‏ فقد كان هناك عدد قليل من مجاميع 
السانات المميزة تارد bou‏ وحجغر Alder 2002; Desrosiéres 1988; Hannah 2011;) Là‏ 
(Hewitt 2010: Lauriault 2012; Poovey 1998; Porter 1995‏ 
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شكل (V-Y)‏ 
الأسئلة المتعلقة بالأفراد خلال التعداد السكاني الايرلندي للسكان ما بين ١141 - ۱۸٤٩‏ 
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تصور (مفهوم البيانات 


المنظور الفلسفي :(Philosophically)‏ 

بالنسبة للبعضء تعد البيانات على المستوى الوجودي (Ontological level)‏ حميدة 
(غير خطرة). فالبيانات هي مجرد بيانات» وعناصر أساسية يتم استخراجها من العام 
بطرق محايدة وموضوعية تخضع لقيود تقنية. فهي "لا تمتلك أي معان ضمنية كامنة 
فيهاء ولا تقدّم بالضرورة أي تفسيرات أو آراء. ولا تحمل خصائص دلالية قد تكشف عن 
أهميتها وصلاتها " )2010 (Pérez- Montoro and Díaz Nafría‏ فهی تخمينية iL‏ 
للتحليل. ومن هذا المنظورء فإن حهاز الاستشعار (sensor)‏ على سيل JULI‏ ليس لدبه أي 
سياسة أو جدول أعمال. فهو ببساطة يقيس الضوء أو الحرارة أو igb II‏ ...الخ - حيث 
يقوم بإنتاج القراءات التي تعكس حقيقة الواقع عن العام المحيط ما لم يشوبه خلل فني. 
وبعبارة أخرىء تنتج أجهزة الاستشعار نظرة موضوعية واقعية عن العام وتكشف عن 
الأشياء كما هي في الواقع» حيث إن قياس واقعية الشيء هو مستقل عن عملية القياس له 
LnÎ .(Desrosiéres 1998)‏ في إطار عمليات القياس التي يلعب فيها العنصر البشري ls»‏ 
مركزيا - في التجارب ال مخبريةء أو إجراء مسح ميداني أو مقابلة شخصية - فإن عمليات 
القياس تطبّق شكلا من أشكل الموضوعية الميكانيكية التي تلتزم بقواعد محددّة. وطرق 
منهجية دقيقة لإنتاج Olly‏ منفصلة, غير متصلةء ونزيهة على نحو شفافء وخالية من 
تحيز الباحث وهواه وتفضيلاته» ومن ثم فهي مستقلة عن العادات. والتقاليدء والثقافهء 
وامعرفة. والسياق )1995 (Porter‏ وعلى هذا النحوء فإن العلم عند ممارسته بشكل 
صحيح لا ينبغي أن يتلبس بأي دوافع سياسية أو أجندات خفية بحيث يمكن بعد ذلك 
أن تؤخذ البيانات على ظاهرها وعلاتها. وف الواقع تقترح المصطلحات المستخدمة عادة 
لتفصيل كيفية التعامل مع البيانات عمليات تقنية حميدة مثل: «الجمع»» «الإدخال» 
«الترجمة»» «التخزين» «المعالجة» و«التنقس» )2013 .(Gitelman and Jackson‏ ولذا 
فإن استخدامات البيانات هي التي تخضع للإملاءات السياسية. وبعبارة آخرىء إن الناس 
هم من يفسدون البيانات ويعملون على تجييرها لمصالحهم الخاصة: وليس للعلم dox‏ 


ذاته. 
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وبالنسبة لآخرينء فإن هذا الرأي لا يمكن تبريره والدفاع «axe‏ إذ sja‏ طبيعة البيانات 
بفعالية من خلال الكيفية التي يمكننا بها تصور البيانات» وقياسهاء والتعامل معها. فبالنسبة 
لهم» البيانات لم تكن موجودة قبل إنتاجها؛ إلا أنها Y‏ تنشأ من العدم. ويتم إنتاج البيانات 
من خلال القياسء والتجريد والاقتباس» وتعميم التقنيات التي تم وضعها ضمن تصور 
لتنفيذ مهمة ما وتسجّل في الأشكال وامقاييس التي تتفق مع ال معايير التي اخترعها الناس 
على سبيل JUL‏ النظام المتري. فالبيانات هي وحدات معرفية. جعلت على نموذج du‏ 
لتمكين وإتاحة العمل ال معرفيء وقياس وتسجيل البيانات عن نفس الظاهرة من خلال 
العديد من الطرق والأساليب» التي يقدم كل منها مجموعة مختلفة من البيانات التي يمكن 
تحليلها وتفسيرها باستخدام وسائل مختلفة )1998 (Poovey‏ فالكيفيات التي يتم إنشاء 
البيانات بهارلا ce‏ حصرها نظرا لتعدد التصاميم والنقاشات والتغذيلات التي تطرأ على 
البروتوكولات: والعملبات التنظيمية: ومعايير القياس» والفئاتء وا معايير الخاصة بالبيانات 
في ظل الفوضى المصاحبة لعملية توليد هذه البيانات وإنتاجها. فلو bisi‏ حالة قياس 
التعداد السكاني لبلد ما: فإن هنالك العديد من القرارات التي يجب أن تتخذ مثل تلك التي 
تحدد من يضاف للتعداد ومن يستثنى منه على سبيل «JUI‏ أن يشمل الزوارء والأجانب 
المقيمين بصورة مشروعة أو غير ides Mia‏ وأولئك الذين يتجنبون المشاركة عن عمد أو لا 
وما إلى ذلك.وأين يجب أن يتم تعدادهم ue‏ سبيل المثفال:تعدادهم les‏ لإقامتهم ليلة 
إجراء التعداد أو مكان إقامتهم II‏ في العادة؛ فجميع أنواع القواعد والإجراءات يتم 
وضعها قبل التعداد» ومع ذلك يظل هناك أمور لم يتخذ قرارات بخصوصها واختلاف عبر 
العدادين في طريقة التطبيق )1995 (Porter‏ 

ونتيجة U‏ فإن LASI‏ المتبعة لتعريف البيانات وتحديدها وجوديا ليست عملية 
فنية محايدة. ولكن معايرة سياسية وأخلاقية يجري التنازع عليهاء ولها نتائج قابلة 
للتحليلء والتفسيرء والعمل في وقت لاحق )1999 .(Bowker and Star‏ ومع “US‏ 
8,1 أخرىء تعمل تبويبات البيانات على استبعاد التباينات والتقلبات وتحديد ما يتاح 
ويحجب داخل مجموعة البيانات» وعلى ex JI‏ من EUS‏ تكون هذه العملية من التقارب 
والاستقرار معرضة على الدوام للممانعة والرفض وإعادة الصياغة بسبب تعدد الجهات 
الفاعلة» وا ملوضوعات والعمليات موضع امناقشة lg‏ والتناقض الحاصل ق البيانات 
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والذي لا مكن تطبيقه بسهولة وما يتناسب مع نظام ما )1999 (Bowker and Star‏ 
وعلاوة على ذلك. فإنه مجرد إنتاج البيانات يكون من ال ممكن فرزء وتقسيم» وتكعيب 
هذه البيانات بطرق متعددة في عدد من الفئات. وبعبارة أخرىء فإن البيانات ليست 
مستقله عن نظام الفكر والآدوات التي تدعم إنتاجها )1999 (Bowker and Star‏ فهذه 
النظم الفكرية dadas‏ بافتراضات فلسفية ومعتقدات تمارس بشكل مختلف. فالواقع: 
وكما لاحظ )38 :2007( Borgman‏ أنه في الوقت الذي يسعى فيه العلم إلى تصوير نفسه 
بالعالمية والعموم» تبدو ممارسات العلوم محلية ومتباينة على نطاق «gels‏ ومن ثم فإن 
البيانات لا تمثل ببساطة واقع وحقيقة العالم؛ فالبيانات هي وحدات بنيوية حول العام 
.(Desrosiéres 1998; Poovey 1998)‏ من هذا امنظور «يتم إنتاج المعرفة العلمية - 
بدلا من براءة اكتشافها» (4 :2013 .(Gitelman and Jackson‏ كما ق JLI‏ 
إذا كان إنتاج البيانات عن طريق أداة مثل شبكة استشعارء فإن تفسير 
هذه البيانات يتظلب فهم الأداة - على سبيل JELI‏ ما الذي تستكشفه أجهزة 
الاستشعار؟ وتحت أي ظروف؟ وكم عدد تكرار مرات ال ملاحظة؟ ومع أي نوع 
من المعايرة؟ )183 :2007 .((Borgman‏ 
ومع ذلك نجد أن العلم يحاول في كثير من الأحيان جعل البيانات حرة ومستقلة 
عن مثل هذا الفهم «SL JI‏ وتنظيم ومشاركة البيانات من خلال قواعد البيانات التي 
يجري التحسين فيها والتخفيف من حدة الفوضى عند إنشائها وحماية ا مستخدمين من 
معرفة 4$ إنتاج البيانات وتنظيمها )2013 gw «Js .(Gitelman and Jackson‏ 
Ribes and Jackson (2013: 165)‏ أن الاستخدامات العلمية للسانات والقائمة على أنها 
محايدة وموضوعية هي مجرد تخيلات لا حقيقة لها؛ أنها «تفترض وتصور العالم بناء على 
البيانات المتداولة دون النظر إلى مصدرهاء وحالتهاء وجوهرهاء وتاريخهاء ومن ثم تبرز 
هذه البيانات على أنها حرة للتنقل عبر العالم كعملة غير متمايزة وعالمية». فى LLI‏ 
هما يؤكدان أن «البيانات هي أكثر ارتباطا من ذلك». 
ونتيجة UI‏ فالبيانات غير مسبقة التحليلء وليست polis‏ موضوعية مستقلة. كما 
بينها )2 :2013( Gitelman and Jackson‏ متبعين في ذلك بوكر )2005( Bowker‏ عندما 
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ذكروا أن "السانات الخام ھی مصطلح متناقض؛ «فالبيانات هي على الدوام مطهوة 
«là s‏ و تكن Laos‏ امنا ' أبدا. فهناك حاجة لتصور البيانات كما هي على الحقيقة في 
الوجود والعمل موحب ذلك )3 :2013 OLJ .(Gitelman and Jackson‏ - على 
Xo‏ سواء - هي اجتماعية من باب أنها تقع ضمن السياقء ومادية من باب أن لديها 
شكلا (كأرقام ثنائية: أو رموزء أو أعداد... وما إلى (EUS‏ ويجري تخزينها على الورق» 
والأشرطة الممغنطة. والأقراص الصلبةء وما إلى ذلك Wilson 2011; Gitelman and)‏ 
.(Jackson 2013‏ كلا ا منظورين يعمل على تشكيل القواعد التأسسية «UU‏ فعلى 
سبيل «JUL‏ تعتمد البيانات الكبيرة على النقاشات الأخلاقية: والاقتصاديةء والسياسية في 
المجالات المختلفة التي تدعم البدء في اعتمادها وتنفيذها (انظر الفصل السابع)» وتعتمد 
على قواعد البيانات» والحواسيب» والخوادم» وشبكات الاتصال التي تمكن بدورها عمليات 
إنتاج البيانات» ومعالجتهاء ومشاركتهاء وتحليلهاء تخزينها (انظر الفصل الخامس). وتسهل 
هذه 3L 8 Ja$L ugJl‏ التثانات (تعفتها)» وسوء تموظعهاء أو dL uo‏ أوَااحَذَفَهَاء أو WSD‏ 
من خلال تلف الوحدة التخزينية للأرقام الثنائية - بت (أي تعطل وسائط التخزين نتيجة 
تحلل الأشرطة الممغنطة أو تضرر الأقراص الصلبة) )2013 .(Boellstorff‏ وف الواقع م 
تكن البيانات قط مطهوّة فقطء ولكنها أيضا منفتحة لتقبّل أساليب «غير مخطط dy‏ وغير 
متوقعة» وعرضية»» و«متحولة بأشكال ii‏ إنسانية معقدة» وطرق زمانية ناشئة لا تتبع 
على الدوام وصفة حسابية محددة مسبقا» )2013 (Boellstorff‏ 
ونظرا للطبيعة الاجتماعية وال مادية للبيانات» فإننا ننشط في إعادة صياغة وتشكيل 
«عواطنا اطاديةء والتقنية» والجغرافية»ء والتنظيمية: والاجتماعية إلى نوع من البيئات 
التي يمكن للبيانات أن تزدهر فيها... والوصول إلى العلاقة التكافلية مع البيانات» 
(Ribes and Jackson 2013: 152)‏ ومن 93« > وبينما ينظر إلى السانات بوصفها شتا 
E E‏ حول الواقع )2013 Shah‏ التأكيد «(Jue‏ فإن الفهم الأكثر إنتاجية 
للبيانات هو اعتبارها أحد مكوّنات الواقع وأحد منتجي الواقع في ذات الوقت. إن 
البيانات ليست محض فكرة تمثيلية مجردةء بل هي تأسيسية. وإنتاجهاء وتحليلهاء 
وتفسيرها له نتائج وعواقب تتبعها. وكما بين )2 :2013( :Gitelman and Jackson‏ 
«إذا كانت البيانات تخضع UJ‏ بطريقة أو بأخرىء فإننا نحن أيضا نخضع للبيانات». 
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E.‏ يتم م التقاط البيانات من العام» ولكن ق LELI‏ تعمل في العالم. إن البيانات م 
ds: Vr‏ ولا مكن أن تكون. حميدة )2013 (Shah‏ بدلا من US‏ من الضرورىي 
فهم «البيانات على أنها مؤطرة متأثرة بغيرها ومؤطرة مؤثرة على غيرها» Gitelman)‏ 
.(and Jackson 2013: 5‏ وبعبارة ag òl‏ هناك حاحة إلى ما هو أكثر من مجرد 
الاعتراف العام من قطاعي العلوم والأعمال لأهمية التصور المفاهيمي للبيانات. 


JI‏ النقدي حول قواعد السانات والىنى daxil‏ للسانات: 

ق العادةء يتم تجميع البيانات في مجاميع (Datasets)‏ قي محاوله ead)‏ البيانات» والتي 
غالبا ما يتم تنظيمها وتخزينها في قواعد بيانات (وهي وسيلة لتنظيم وتخزين البيانات 
التي مكن الاستغلام عنها بطرق متعددة) وبنى تحتية للبيانات مشل نظم ال محفوظات 
الأرشيفية (Archives)‏ وحاويات البيانات (Repositories)‏ (انظر الفصول الثاني والثالث 
والخامس). وكما كان الحال مع التصور ا مفاهيمي للبيانات بشكل cale‏ فمن UIS eel‏ 
التفكير بشكل نقدي حول طبيعة قواعد البيانات والبنى التحتية للبيانات» وإنتاجها من 
الناحيتين الاجتماعية والتقنية (Socio- Technical)‏ وكيف أنها تعكس العقلانية حول 
العام في الوقت نفسه لأنها تتكاثر وتعزز هذه العقلانية. وكان هذا التفكير النقدي غائبا 
إلى حد كبر فيما يتعلق بالبيانات الكبرةء والبيانات المفتوحةء والبيانات الصغيرة الموسعة: 

مع التركيز حتى الآن عليه ليكون ذا طبيعة تقنية وآلية بشكل أكبر. 

وتمتذ الفرضية ا لمطروحة التي تم” تبنيها وتطويرها في جميع أنحاء هذا الكتاب من الحجة 
المبنية في القسم الأخيرء وهي الافتراض بأن قواعد البيانات والبنى التحتية للبيانات ليست 
ببساطة محايدةء أو وسائل تقنية لتجميع وتبادل البيانات؛ وليست بالتأكيد منتجات لتخزين 
البيانات الملتقطة عن العالم؛ ولكنها حزم من العمليات الطارئة والمترابطة التي تقوم بتأدية 
الأعمال في العام )2011 .(Star and Ruhleder 1996; Kitchin and Dodge‏ انها أنظمة 
اجتماعبة juis‏ معقدة كامنة كجزء لا يتجزأ > ضمن ال مشها المؤسساق SYI‏ من الباحثنء 
«UL Sls‏ والشركات» التي تشكل أدوات أساسرة في إنتاج المعرفة والحكم ورأس JUI‏ 

ويتم تصميم slug‏ قواعد البيانات على تقبّل أنواع معينة من البيانات وتمكين أنواع 
معينة من التحليلء ولذا فهنالك آثار عميقة مترتبة على الكيفية التي يتم بها هيكلتها على 
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الاستفسارات والتحليلات الممكن آداؤها؛ كما أن شروط صياغتها من شأنها أن تحدد العمل 
الذي ممكن القيام به عليها ومن خلالها )2012 (Ruppert‏ فعلى سبيل «JUL‏ يختلف 
تخزين البيانات في قواعد البيانات اختلافا تاما عن الشكل السردي من حيث ما 3& تخزينه: 
وكيف يتم 355 42( وكيف من ال ممكن استدعاؤها وإعادة استخدامها )2005 (Bowker‏ 
وينتج عن قواعد البيانات إهمال dalag‏ لبعض البيانات» إضافة إلى الثغرات الكامنة في 
البيانات» وذلك كلما تم الكشف عن علاقات بين البيانات وتوفير الإجابة عن بعض الأسئلة 
التي يتعين الإجابة عنها؛ فهي تقيّد وتتيح من خلال وجودها (الأنطولوجيا)» وتنتج العديد من 
العلاقات في ذات الوقت الذي يتم فيه إخفاء علاقات أخرى )2013 (Ruppert 2012; Vis‏ 
واستنادا إلى Derrida‏ فقد جادل )12 :2005( Bowker‏ بأن قواعد السانات والمحفوظات 
الأرشيضشة هي المتحكم :(jussive)‏ فهي "تقول UJ‏ ما نستطيع وما لا نستطيع أن نقوله" من 
خلال تحديد ما مکن تذكره وما يجري تجاهله ونسيانه. فهذا التذكر والتناسی يتم تحديده 
في الأصل من خلال أنظمة وممارسات مبنية على قوانين سياسية وفلسفية. 

ومن هنا فإن التبويبات داخل قواعد البيانات غير ثابتة وغير طبيعية» ولكن يتم إنشاؤها 
من قبل جهات فاعلة ذات أهداف محددة تعمل ضمن مجتمعات ال ممارسة. أساليس 
الحوكمة» والقيود التقنية الفنية. ومن ثم» فإن قواعد البيانات هى تعابير عن السلطة / 
المعرفه وهي تقوم بإقرار تشريعها وإعادة إنتاج هذه العلاقات )2012 (Ruppert‏ على 
سبيل waos «JUL‏ معدل التأمين لشخص ما أو ما إذا كان بإمكانه السفر بين البلدان. 
وعلاوة على US‏ فإن قواعد البيانات هي كيانات ديناميكيه متغيرة تقوم بإجراء dlas»‏ 
مستمرة من التمييز والتفريق» )129 :2012 (Ruppert‏ من خلال التفاعل مع مجاميعها 
المرتبطة بها (المنشئونء المستخدمون: «oes JI‏ الأجهزة. الشبكات» وما إلى ذلك). 

وفي الوقت نفسه. عملت قواعد البيانات على فصل عملية تحليل البيانات عن البيانات 
نفسها من خلال تمكين إجراء استعلامات وحسابات معقدة دون الحاحة إلى إجراء هذه 
التحليلات التي تتطلب الاطلاع والعمل مع البيانات نفسها أو حتى فهم الكيفية التى 
تم من خلالها تجميع البيانات وتنظيمها )2013 .(Gitelman and Jackson‏ وقد تم 
تعزيز هذا الفصل من خلال اليات مثل التوحيد العياري (Standardization)‏ للصيغ 
والبيانات الوصفية والتعامل مع البيانات دون النظر إلى السياق الواردة فيه وبعيدا عن 
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التأثير السياسي )2011 (Wilson‏ والأهم من ذلكء فإن هذا الفصل والتحرير للبيانات 
قد مكن السلطة / المعرفة المتعلقة بقواعد البيانات من الانتقال والانتشار وليتم توظيفها 
من قبل الآخرين بعيدا عن الأعمال الداخلية المعقدة فيها وتاريخها وسياسة الإنتاج لها 
(بالطريقة نفسها التي يستفيد فيها السائق من السيارة من دون معرفته guo LAS‏ كل 
أنظمتها المعقدة أو ماذا تعمل أو LAS‏ تفاعلها لتشكيل تجربة القيادة). ومن ثم مكن 
للباحثين الاستفادة من قواعد البيانات الحكومية مثل التعداد GKI‏ أو المسح التجاري أو 
المؤشرات الاقتصادية دون معرفة الدوافع السياسية لم وكيف تم بناء قواعد البيانات» أو 
الجوانب الفنية لإنتاجهاء أو وجود الألفة الشخصية مع الظواهر الملتقطة. على سبيل JE‏ 
استخدام الوزارة الإيرلندية للبيئة لقواعد بيانات عقارية غير مكتملة في آيرلندا في مرحلة 
ما بعد الانهيار الاقتصادى 2008 (متوفرة على الرابط: 


(http://www.housing.ie/OurServices/Unfinished-Housing-Developments.aspx 


حيث كان للمرء أن يجري «Sol‏ والتصورء والاستخلاص للنتائج حول العقارات في 
إيرلندا دون أي معرفة مسبقة عن تاريخ وسياسات ال مسح. وكيف تم القيام «b‏ ودون زيارة 
أي من تلك العقارات (انظر .(Kitchin et al., 20124, b‏ فمثل هذا التحرير والفصل مكن 
من العمل مع قواعد البيانات على أنها غير متغيرة ومستقرة وقابلة للتحول والنقل عبر 
المكان والزمان )1989 (Latour‏ 

وتستضيف البنى التحتية للبيانات قواعد البيانات وتصل بينها لتشكل بنية تقنية 
اجتماعية أكثر تعقيدا. وكما هو الحال مع قواعد البيانات» لا يوجد شيء كامن أو مُعطى 
حول كيفية تكوين هذه الهياكل الأرشيفية والتشاركية. وف الواقع» وكما نوقش في جميع 
انحاء الكتاب» تعرض تصميم وإدارة البنى التحتية للبيانات إلى تحديات تقنية وسياسية تم 
التصدي لها من خلال نقاشات فوضوية ومفاوضات عبثية تمت ف سياق أتصف بالعديد 
من الأجندات (جداول الأعمال) والقولبة الحكومية. فالحلول التي تم إيجادها والمتعلقة 
بالمعاييرء والبروتوكولات» والسياسات» والقوانين كانت بطبيعتها ذات آثار تقريبية كونها 
هدفت إلى تثبيت أرضية مشتركة وتعميم ال ممارسات ونشرها بين ا لمطورين والمستخدمين 
(Lauriault 2012)‏ والتمويه على وتخفيف حدة التوتر والتباين بين قابلية الاستخدام 
وإتاحته والحد من التخصيص وتقييد الابتكار» ومنع الطرق البديلة لهيكلة وترتيب البيانات 
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.(Star and Ruhleder 1996)‏ وبالنظر إلى حدة التوترات» ينبغي التأكيد على عمليات 
التقريب باستمرار وبشكل متكرر من خلال التطبيقء والإدارةء وأنظمة الحوكمة Star and)‏ 
.(Lampland, 9‏ لذلك» أكد 112 :1996( Y» æl (Star and Ruhleder‏ وجود لمركز 
مطلق يصدر dio‏ التحكم وامعايير؛ وكذلك. لا أطراف مطلقة ... مع كون البنية التحتية 
شىء ظاهر للناس ف الممارسة العمليةء ومتصلا بالأنشطة والهياكل». 


فهذا الظهورء وعلى e£ JI‏ من عدم تركزه بشكل کامل» ليس شكلا حرا وهو يتشكل 
من خلال علاقات dgs‏ واسعةء فقد حادل(2001) ob Graham and Marvin‏ الىنى 
التحتية هي تأسيسية نتيجة «تراكمات بعيدة المدى من التمويلء والتكنولوجياء والدراية: 
والسلطة التنظيمية والجيوسياسية» (ص. 12( والمحافظة على «الهندسة الفنية الاجتماعية 
للسلطة» (ص. 11) من المصالح الاجتماعية المتحجرة. وتشمل هذه التراكمات أنظمة من 
التشريعات تسعى من الناحية القانونية ومن خلال أشكال الحوكمة لتحديد كيفية إدارة 
وتحليل ومشاركة البيانات» على سبيل JELI‏ قوانين حماية البيانات (انظر الفصل العاشر). 
ولذلك» اقترح )8 :1987( Starr‏ أن البنية axl‏ للبيانات لدنها: 

نوعان من الهياكل التنظيمية - الاجتماعية والمعرفية: فالتنظيم الاجتماعي يتكون من 
العلاقات الاجتماعية والاقتصادنة لأفراد العينة الممثلة: وأجهزة الدولةء والشركات الخاصة: 
والمنظمات امهنية والدولية» وغيرهم من المشاركين فى إنتاج تدفقات البيانات من مصادرها 
الأصلية وحتى نقاط التحليلء والتوزيع: والاستخدام: في حين يشير التنظيم ال معرفي لهيكلة 
البيانات نفسهاء ا في ذلك حدود الاستعلام: والافتراض عن الواقع الاجتماعي» وأنظمة 
التصنيف» وطرق القياسء والقواعد الرسمية لتفسير وعرض البيانات. 

كما أكد )2007( Dourish and Bell‏ أنه لا مكن النظر بصورة صرفة لقواعد البيانات 
والبنى التحتية كوسائل وأدوات ثانوية لأنها تشمل بطبيعتها نواحي 4,3035 واقتصادية: 
ومعرفية» وهي غارقة في الأهمية على المستوى الاجتماعي. ولذلك اقترحا منظورين يمكن 
من خلالها فهم البنى التحتية للبيانات: المنظور الأول يتضمن قراءة اجتماعية سياسية 
يدرس من خلالها «بلورة العلاقات المؤسسية» (ص. 416). أما المنظور الثانى فهو القراءة 
التجريبية التي تدرس " كيفية تشكيل البنى التحتية للبيانات لإجراءات الأفراد وخبراتهم" 
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(ص. (£V‏ وف EIS‏ الحاتينء تفهم البنى التحتية للبيانات ككيانات مترابطة. ويعيد هذا 
الترابط تشكيل العالم بشكل عرضي بناء عليهاء وهي بدورها تتشكل من قبل العالم كذلك. 
ولك La‏ إلى استخدام قواعد البيانات والبنى التحتية للبيانات والاعتماد عليها لفهم 
العام والقيام بأعمال 443« فإن ممارساتنا المنطقية والمادية تتكيّف وتتمحور كاستجابة لهما 
.(Star and Ruhleder 1996)‏ ولا ينعكس العا في البيانات فقطء بل يتغير بها؛ «فالعمل 
على إنتاج وحفظ وتبادل البيانات ومشاركتها agi‏ بإعادة تشكيل العوام التنظيمية: 
والتكنولوجبة» والثقافية من حولهم» )147 :2013 (Ribes and Jackson‏ 

وبعبارة أخرىء لا تدعم قواعد البيانات والبنى التحتية للبيانات البحوث ببساطة 
ولكنها تغير وبشكل جذري ال ممارسات والنظم البحثية - الأسئلة المطروحة: وكيفية طرحهاء 
وطريقة الإجابة عليهاء وكيفية تطبيق الإجابات» ومن يجري البحث وكيف يعملون بصفة 
باحثين (انظر الفصل الثامن). فعلى سبيل «JU‏ وف دراستها لتطور التعداد iS JI‏ 
الكندى وأطلس كنداء ببّنت )2012( Lauriault‏ بالتفصيل كنف تطور كل تعداد بشكل 
متواتر ومتكرر على أساس نماذج للعالم شكلت طرقاً لتصور وعرض كندا. وقد جادلت بأن 
محفوظات البيانات والبيانات نفسها تشكل «نظام ذاكرة خارج الجسم المؤسسي يسمح 
بسرد قصص عن طبيعة كندا... من خلال الخرائط والرسوم البيانية والنماذج والإحصاءات 
التي تعتمد على أجهزة الاستشعار.ء والبيانات» وقابلية التشغيل البيني» ومعايير رسم 
الخرائط على شبكة الإنترنت» والبوابات الإلكترونية» والبيانات الوصفية والنماذج» والعلوم: 
والهياكل المفتوحة» (ص. (YV‏ ف «Jill‏ تعدل هذه القصص النماذج الأساسية ومن ثم 
البنية التحتية للبيانات» مما يعمل على تحوير الوسائل التي يتم من خلالها إنشاء القصص. 

ويتطلب تفهّم قواعد البيانات والبنى التحتية للبيانات التفكيك والتفريغ بعناية لطبيعة 
نشوتهاء وتداخلهاء وعلائقیتهاء وسياقيتها )1996 .(Star and Ruhleder‏ وهذا يعني Soal‏ 
فيما وصفه )34 :1999( aU Bowker and Star‏ انعکاس Infrastructural) o» LI‏ 
(Inversion‏ أي أن ندرك أعماق الترابط بين الشبكات التقنية sols ls‏ الفنية. من digo‏ 
والعمل الحقيقي للسياسة وإنتاج المعرفة من جهة أخرى. وكما 5 )2012( .Lauriault‏ 
فإن هذا يتطلب Laf‏ تحليلا تاريخيا sies‏ كيف تتطور قواعد البيانات والبنى التحتية 
للبيانات مع مرور الوقت وتغير QUA‏ 
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: (Data Assemblages and the Data Revolution) مجاميع البيانات وثورة البيانات‎ 

كان الجدل والحجة الرئيسية ال معروضة في هذا الفصل بان التفكير بالبيانات لا يكون 
بالطريقة المبماشرة: ولا مكن أن توجد البيانات بشكل مستقل عن الأفكارء والآليات. 
والتقنيات» والنظم» والناس» والسياقات» بغض النظر عن كونها في كثير من الأحيان يتم 
تصورها بهذه الطريقة )2013 .(Lauriault 2012; Ribes and Jackson‏ فالبيانات يتم 
إنشاؤها بوصفها نتاجا لكثير من العقول العاملة في مختلف الحالات والأوضاع» وهى مؤطرة 
وتتشكل في ظروف وهياكل مختلفه. 

li Js‏ فإن من طرق فهم البيانات هو التفكير بها كقضية مركزية لتجمّع فنى 
اجتماعي معقد. ويتكون هذا التجمع للسانات من العديد من الأدوات iai‏ 
التي تزداد تشابكاء وتطوزاء وتتحوّر مع مرور الزمن وتبدل المكان (انظر الجدول1-3). 
وتصوغ JS‏ أداة lapolis, di gouan‏ ما هو ممکن» وما هو,مظلوب. وما هو متوقع 
من البيانات. لسسع mE NY‏ 
من خلال شبكة معقدة ومتغيرة من العلاقات المتعددة الأوجه (انظر الشكل 3- 
وكما اذعى كل من )2013( «Ribes and Jackson‏ فإن هذه الآدوات لا تقوم p^‏ 
ماهية وكيفية إنتاج البيانات وإلى أي حد من الممكن توظيفها فحسب. ولكنها بحد 
ذاتها منظمة ومدارة لتقوم بإنتاج مثل هذه البيانات. US deg‏ فإن البيانات 
ومجاميعها تتشارك التحديد (Co-determinous)‏ وتتىادل عملية التشكيل كل منها 
للاخر (Mutually Constituted)‏ وترتبط سعضها من خلال مجموعة من الممارسات 
والعلاقات المنطقية والمادية الطارثئة: والغلائقية, والسياقية. (deg‏ ذلك. يختلف JS‏ 
تجميع للبيانات في نسق ترتيب العناصر وسياقهاء ولكنها تتشارك في قواسم مشتركة 
وتأثير كل منها في الآخر بسبب اعتماد الأدوات على بعضها وتداخلها والاتفاقيات التى 
تغطي مجاميع البيانات» ومع نشوء أفكار ومعارف جديدة: واختراع التقنيات» وتطوير 
المهارات» وانفتاح الأسواقء فإن مجاميع البيانات تتطورء وتتحوّرء (qua A39‏ وتتفكك. 
ونتيجة لذلكء. هناك تنوع كبير من تجمعات البيانات عبر النطاقات والاختصاصات 
امختلفة. 
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جدول رقم (V-Y)‏ 
الأدوات والعناصر مجاميع السانات 


الجهاز / النظام العناصر 

طرائق التفكير. الفلسفيات, النظريات» النماذج الإيديولوجيات, 
امنطقياتء.... إلخ. 

النصوص البحثية» الأدلةء المجلات: المواقع الإلكترونية: الخبرة» الخطب» 


نظم الفكر 


أشكال المعرفة 
منتديات الدردشة.... إلخ. 

نماذج الأعمالء الاستثمارء رأس ال مال الاستثمارىء gabl‏ التبرعات والصدقات» 
Qu JJ‏ إلخ. 

السياسة» الأنظمة الضريبية» الرأي العام والرآي السياسيء الاعتبارات 
الأخلاقية»... إلخ. 
معابيير البيانات» صيغ الملفات. متطلبات النظم: اللوائح البروتوكولية: 
القوانين» الترخيصء أنظمة الملكية الفكرية.... إلخ. 
الأوراق / الأقلامء الحاسبات AJY‏ الخدمات الرقمية» أجهزة الاستشعارء 
اماسحات الضوئية: قواعد البيانات» شبكات الاتصالء الخوادمء... إلخ 









الجوانب الإدارية 






والقانونية 
الأصول امادية والبنى 
التحتبة 
اممارسات 
المنظمات والمؤسسات 
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E 





التقنيات» طرق التنفيذء السلوكيات ا مستفادة. الاتفاقيات العلمية.... إلخ. 

سجلات الأرشفة» الشركات» ال مستشارونء ال مصنعون:ء بائعو التجزئة: الجهات 

الحكومية» الجامعات» ا مؤتمرات: النوادي واطمجتمعات» واللجان واممجالس» 

المجتمعات اممارسة.... إلخ. l‏ 

القخصنات واللجتمعات: | oz‏ و التناننات: القثمون e‏ المانتات, المتذرون: اللحلنون: العلماء. 
السياسيونء ا مستخدمون. المواطنونء... إلخ. 

الأماكن المختبرات. المكاتب» مواقع العملء مراكز البيانات. مجموعات الخوادم 





مجمعات الأعمال»... والقوى البشريه المتصلة بها. 
الأسواق «UU‏ ولملشتقاتها (على سسل «JULI‏ النصوص. الجداولء المخططات» 
(hl Sl‏ والمحللون»ء وبرمجيات التحليل» والتفسيرات.... إلح. 
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فهذا الكتاب يبحث ف تجمعات البيانات الناشتة: والمتطورة: اممنتجة للبيانات ال مفتوحة. 
والبنى التحتية للبيانات» والبيانات الكبيرةء وللقيام بذلك يطرح OLII‏ ثلاث مسائل رئيسية 
للمناقشة: أولاء هناك حاجة لتطوير طرق مبدئية وفلسفية لفهم البيانات. فهناك نقص 
ملحوظ في التفكير النقدي والبحثي عن البيانات وفي البيانات بحد ذاتها من حيث التكوين 
والتشغيل للمجاميع المحيطة deg dy‏ الخصوص SLL‏ مع التركيز والاهتمام اللذين 
تحظى به مفاهيم ال معلومات وال معرفة. وذلك على الرغم من ان البيانات هى عنصر اساسى 
في إنتاج المعرفة. ثانياء هناك تورة Ollo‏ جارية تعمل على تشكيل لحظة حاسمة في تطور 
وتحوّر تجمعات البيانات. ونظرا لالتقاء العديد من التطورات الناشئة ف مجال الحوسبة 
والتقنيات المنهجية: والمجالين السياسي والاقتصادي» فإن حجم البيانات» وتنوعهاء وسرعتهاء 
ودقتهاء وتؤافزها والكيفية التي يتم بها فعالجة البيانات وتحليلهنا وتخزينها وتوظيفها 
لزيادة الّصر وتحصل القيمةء قد شهد fois Js od‏ ثالث يا مختلف التحديات 
التقنية والأخلاقية والعلمية التي أثارتها ثورة البيانات» فإن هناك حاجة ملحّة لتطوير فهم 
مفصل لتجمعات البيانات الجديدة والناشئة التي يتم إنشاؤهاء ولذا تهدف الفصول العشرة 
التالية إلى توفير نظرة إجمالية على نطاق واسع» وشامل» ودقيق لهذه التجمعات وتسليط 
الضوء على القضايا التي تتطلب مزيدا من الاهتمام والبحث. 
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شكل )١-7(‏ 
التقاطع بين آدوات مجاميع البيانات 
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الفصل الثانى 
السيانات الصغيرة (Small Data)‏ والبنى التحتية للسانات 
«(Data Infrastructures)‏ ووسطاء السيانات (Data Brokers)‏ 


قبل بضع سنوات مضت كان مصطلح «البيانات الصغيرة» 36 الاستخدام» إن م يكن 
Wad‏ وقد ذاع انتشاره مصطلحا بحكم الواقع على النقيض مما سمّى «البيانات الكبيرة». 
فكل البيانات كانت ف الواقع بيانات صغيرة ومن ثم لم تتطلب تمييزها بهذا P‏ 
وسيجري لاحقا مناقشة ما قام على تأسيس البيانات الكبيرة بالتفصيل à‏ الفصل الرابع 
ولكن من الضروري تسليط الضوء على الفرق بين البيانات الصغرة والبيانات الكبيرة. وذلك 
قبل التوجه إلى مناقشه LAS‏ تحول البيانات الصغيرة من خلال الىنى التحتية الجديدة 
للبيانات والأسواق SAALI‏ ببلايين الدولارات» كما سيتم لاحقا في الفصل التالي مناقشة 
انفتاحها لتقبل المشاركة وإعادة الاستخدام. 

فمن الناحية التقليدية: ونظرا للتكاليف والصعوبات المصاحبة لعمليات إنتاج ومعالجة 
وتحليل وتخزين البيانات» فقد تم إنتاج البيانات الصغيرة بطرق مضبوطة بأحكام باستخدام 
تقنيات أخذ العينات التى تحد من نطاقهاء وصلاحيتها الزمنية؛ وححمها )2010 (H.J. Miller‏ 
ios‏ ممكن أن تكون بعض قواعد البيانات كبرة le‏ في الحجم» مثل قاعدة بيانات التعداد 
الوطني» ولجعل ممارسة تجميع هذه البيانات قابلة للإدارةء فإن عملية إنتاجها عادة ما تتم 
خلال بضع سنوات وتكون محدودة å‏ النطاق (في حالة التعداد. يجرى في العادة مرة واحدة كل 
عشر سنوات ويكون مقتصرا على ثلاثين إلى أربعين سؤالا فقط). وعلاوة على «US‏ فقد كانت 
دقة البيانات الصغيرة العامة (Small Tertiary Data)‏ في كثير من الأحيان ضعيفة جدا (كانت» 
على سبل «JULI‏ على مستوى المقاطعات أو الدول وليس الأفراد والأسر « كما أن الأسالبب 
المستخدمة لإنتاجها غير مرنة على الإطلاق (على سبيل «JU‏ من ال مستحيل تعديل الأسئلة أو 
الإضافة لها أو الإزالة منها مجرد التهيئة للتعداد وإعداده والبدء بإدارته OM‏ ذلك سينعكس 
Li.‏ ويبشكل جدى على القدرة على المعالجة والتحليل). وف المقابلء تتميز البيانات الكبيرة 
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جدول رقم (Y-Y)‏ 
مقارنة السانات الصغيزة والسانات الكبيرة 


iria 


f 


CA 


5 
fo: 
«o 





وف الوقت الذي تعد فيه البيانات الصغيرة واحات صغيرة ضمن صحارى البيانات» 
تنتج البيانات الكبيرة طوفان بيانات حقيقي. وقد آذى ذلك بالبعض إلى التساؤل عما إذا 
كانت البيانات الكبيرة قد تؤدي إلى زوال البيانات الصغيرة أو تضاؤل مكانة الدراسات التى 
تعتمد على البيانات الصغيرة نظراً لمحدوديتها (à‏ الحجم» والنطاقء والصلاحية الزمانية. 
فقد لاحظ )2008( Sawyer‏ أن وكالات تمويل البحوث الأكادمية: على سبل «JU‏ توجه 
موارد التمويل المحدودة الخاصة بها إلى مجالات السانات dudl‏ على نحو متزايد. وذلك 
رها بسبب التداخل بين حجم البيانات وسرعتها مع مقدار التبصر والتوظيف والقيمة؛ 
وأن هذه الوكالات تحول الأسئلة البحثية التي من الصحعب أن تنتج بيانات كبيرة لجهات 
التمويل الأخرى المتعددة وتمنحها وضع هامشي داخل وخارج هذه المؤسسات الأكادمية. 


منطقية / العلائقية قوية 
in‏ 
o‏ محدودة إلى واسعة 


dsw 
ليه‎ 


التمويل نحو البحوث التجريبية التطبيقية ذات الشراكة الصناعية. وقد أدى إعادة الترتبب 


n 
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لأولويات البحث إلى سوء الفهم لطبيعة البيانات الكبيرة وقيمة البيانات الصغرةء فالبيانات 

الكبيرة رما تهدف إلى أن تكون شاملة: ولكن كما هو الحال مع جميع البيانات فإن كليهما 

عبارة عن تمثيل (Sample) dusg (Representation)‏ فماهية البيانات التي يتم التقاطها 

Id‏ في الواقع من خلال التالى: 

٠‏ مجال إطار عرض/ أخذ العينات (حيث يتم توظيف أجهزة التقاط البيانات وماهية 
إعدادات التهيئة لها/ ومعاملاتها؛ مثل من يستخدم المكان أو وسائل الإعلام» وعلى سبيل 
JULI‏ من الذي ينتمي إلى وسيلة التواصل الاجتماعي الفيسبوك أو يتسوّق في محلات 
وول مارتء..إلخ). 

o‏ التقنية والمنصة المستخدمة (المسوحات ال مختلفة: وأجهزة الاستشعارء والعدسات. 
وامطالبات «dua!‏ وا ملخططات والتصاميم... la lS 9 «el‏ € فروقا وتباينات Lalo à‏ 
البيانات التي يتم إنشاؤها). 

d cu) فيه (الأحداث الجارية تعنى أن البيانات تقع دائما‎ LUI السياق الذي يتم إنشاء‎ o 
إلى الظرف الذي تقع فيه).‎ 

o‏ تبويبات (أنطولوجية) السانات اممستخدمة (كيفية معايرة البيانات وتصنيفها). 

« البيئة التنظيمية فيما يتعلق بالخصوصيةء وحماية وأمن البيانات. 


وتلتقط البيانات الكبيرة في العموم ما هو سهل التقاطه - أي البيانات التي يتم التعبير 
عنها علنا (ما كتبء :545( ومُسح ضوئيا. وما تم استشعاره... إلخ؛ وتصرفات الناس وسلوكهم؛ 
وحركة الأشياء) - وكذلك البيانات المستنفذة والتى هى ناتج وظيفة رئيسية وليست ال مخرج 
الرئيسيء» والبيانات الوصفية التي تمّ إنشاؤها تلقائيا. وتأخذ البيانات الكبيرة هذه البيانات 
بالقيمة الاسمية: على الرغم من أنها قد لا تكون قد تم تصميمها للرد“ على أسئلة محددة 
والبيانات الناتجة قد تكون عشوائية وغير دقيقة (انظر الفصل التاسع). 

أما البيانات الصغيرة فقد تكون محدودة ف الحجم de ulg‏ ولكن لديها تاريخا طويلا 
من التطويرء مع منهجيات مقررة وأطوار للتحليل» وسجل حافل من الإجابات الناتجة للأسئلة 
العلمية. ويممكن لدراسات البيانات الصغرة أن تكون مصممة بشكل أفضل بكثير للرد على 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 10 





7 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الثاني 


أسئلة بحثية محددة والاستكشاف المفضل وال معمّق للطرق المتنوعة: والسياقية: والمنطقية 
وغير المنطقية التي يتعامل بها الناس» ويتم فهم العام بهاء وكيفية عمل العمليات العلمية 
(انظر الفصلين الثامن والتاسع). ومكن أن تركز البيانات الصغيرة على حالات محددة PEEP‏ 
عن قصص فردية» وسياقيةء ودقيقة. وبسبب أنها تستهدف ظاهرة معينة» فهي تركز بشكل 
مكثف على قضية وعادة ما تكون أقل حاجة للموارد بشكل مكثف: وتسعى دراسات 
البيانات الصغيرة على التنقيب عن الذهب من خلال العمل في شق ضيق للغايةء في حين 
تسعى دراسات البيانات الكبيرة إلى استخراج شذرات من خلال التعدين في حفرة مفتوحة 
وشفط وغربلة مساحات شاسعة من الأراضي. ومن ثم فقد برهن )2008( Sawyer‏ على أن 
التمويل يحتاج إلى استهداف الإجابة عن الأسئلة الحرجةء سواء كانت معالجتها باستخدام 
بيانات صغيرة أو كبيرة» وليس مجرد أن توجّه نحو المشاريع التي يمكنها الوضول إلى كميات 
هائلة من البيانات على أمل أنها تحوي بطبيعتها رؤى وأفكارا مفيدة. 

di Ss‏ يمكن القول إنه من ال ممكن تحصيل المزيد من القيمة والرؤى من البيانات 
الصغيرة من خلال توسيغ نطاقها إلى مجموعات بيانات أكبر. وجعلها متاحة لإعادة 
الاستخدام من خلال البنى التحتية للبيانات الرقمية والتي تجعلها إضافة إلى ذلك قابلة 
لمختلف أشكال التحليل الحسابيء والحفاظ عليها للأجيال القادمة. ونتيجة UI‏ وكما هو 
الحال مع البيانات الكبيرة. فقد استثمرت موارد كبيرة في السنوات الأخيرة لإنشاء مثل هذه 
البنى التحتية للبيانات» والتي أحدثت تغييرات كبيرة في مشهد البيانات. 


حاويات السيانات «(Data Holdings)‏ محفوظات السانات (Data Archives)‏ 
والبنى :(Data Infrastructures) DULU dusil‏ 
كم جخ البيانات معا وتغزيتها لقترة طويلة من الناريخ call‏ جل وقد كانت هذة 
الممارسات غير رسمية ورسمية على حد سواء في طبيعتهاء فالممارسات غير الرسمية تتكون 
ببساطة من جمع البيانات وتخزينهاء في حين تتكون الممارسات الرسمية من مجموعة 
اممارسات الفاعلة ذات العلاقة بإدارة 8L özgə‏ السانات (Data Curation)‏ والصساكل 
المؤسسية المصممّة لضمان الحفاظ على السانات من أجل الأجيال القادمة. وقد يكون من 
الأفضل وصف اممارسات غير الرسمية بأنها حاويات البيانات» في حين أن الممارسات الرسمية 
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هي محفوظات (أرشيفات) البيانات. ويجري» في كثير من الأحيان» الخلط بينهما أو تستخدم 
بالتبادلء جنبا إلى جنب مع غيرها من ا مصطلحات مثل النسخ الاحتياطى (Backup)‏ 
وبنك المعلومات (Information Bank)‏ ومستودع البيانات «(Data Repository)‏ ولكن 
المحفوظات الأرشيفية تمتلك خصائص مميزة عدا عند أمناء المحفوظات (Archivists)‏ 
ا مهتبين. 

فالمحفوظات هي مجموعات رسمية منظمة من البيانات التي يتم هيكلتها وتوتيقها 
ونشرها بشكل فعال» مصحوبة بالبيانات الوصفية المناسبة لهاء مع التخطيط JAI‏ لقضايا 
المحافظة Ue‏ وإتاحة الوصول U Jl‏ وإمكانات اكتشافها )2013 .(Lauriault et al.‏ 
فا محفوظات تهدف بشكل واضح وصريح وطويل الأمدء للحفاظ على البيانات لإعادة 
استخدامها في المستقبل. إن مفهوم الحفاظء في هذا السياق» لديه استخدام خاص محدد على 
أنه مجمواعة ققَاالأنفطة اْدّارة والمدعمة «بالمبادئ. النشناسات. Eli]‏ والاشتراتيجيات 
الرامية إلى إطالة أمد الكائن (البيانات) من خلال المحافظة عليه ف حالة مناسبة للاستخدام 
el‏ على شكله الأضلي el‏ في شكل مُستدام أكثر ثباتاء مع الإنقاء على الشكل الفكري 
للكائن» )2013 ,2 .(InterPARES‏ ويسعى الأرشيف للحفاظ على مجموعة سجلات كاملة: 
وليس مجرد البيانات؛ أي أنها تشمل كل الوثائق الداعمة والبيانات الوصفية وغيرها من 
المواد ذات الصلة التي تحتوي على تفاصيل المنشأ والسياق فيما يتعلق بكيفية إنتاج البيانات 
والطريقة التي ينبغي أن تعامل وتحلل وتفسّر بها. فالنهج المتبع في الحفاظ على البيانات 
مبني على الإدراك التام بأن التقنيات والبروتوكولات واطبادئ التوجيهية لأفضل الممارسات 
هي عرضة للتغيير والتقادم» معنى أن البيانات سوف glos‏ للتنقل والترحيل عبر منصات 
وتقنيات بسبب الابتكارات الجديدة التي b‏ في السياقء كما يدرك النهج المتبع بأنه دون 
ممارسات فعالة لإتاحة وإعادة الاستخدام والمشاركة للبيانات فإن البيانات معرضة للتلف. 
او الضياع. أو الحرمان من بياناتها الوصفية السياقية والوثائق الداعمة );2007 Borgman‏ 
.(Dasish 2012‏ ويسعى المحفوظ الأرشيفي إلى توفير موارد جديرة بالثقة. من خلال الحفاظ 
على سلامه البيانات (Data Integrity)‏ مع مرور الوقت. 

وف بعض الحالات» قد يلزم مؤتمنو البيانات (Data Custodians)‏ مسؤوللية قانونية 
لحفظ وأرشفة البيانات بشكل مناسب لإعادة الاستخدام الحالي والمستقبلي. كما قد يكون 
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المؤتمن على الأرشفة والقائم عليها نفسه سلطة قانونية تشريعية. فعلى سبيل «JUI‏ 
فإن ال محفوظات الأرشيفية الوطنية والوكالات الإحصائية الوطنية هي الكيانات القانونية 
التى عهد إليها جمع وإنتاج وأرشفة قواعد بيانات محددة مثل السجلات الشخصية 
للأفراد والحسابات القومية» والتعدادات والمسوح السكانية. وينبغي أن تمتثل اا لملحفوظات 
أيضا للتشريعات المتعلقة بحقوق الوصول إلى البيانات» والخصوصية. والمبادئ الأخلاقية, 
وحقوق الطبع والنشرء والملكية do JI‏ وتحديد المسموح لهم للوصول إلى البيانات وما 
يمكنهم القيام به من خلال تحديد الصلاحيات على البيانات. على سبيل «JUL‏ في العديد 
من البلدان» من ال ممكن نشر سجلات التعداد في شكل إجمالي» مع تقييد نشر السجلات 
الشخصية إلى ما بعد مئة (ele‏ فالالتزام بإتاحة الوصول وإعادة الاستخدام للبيانات لا يستلزم 
بالضرورة العمل على نموذج مفتوح (انظر الفصل الثالث)ء ولكن ينبغي أن يتم ضمان توافر 
البيانات في المستقبل للمجتمع المستهدف بطريقة قانونية )2012 .(CCSDS,‏ إن المجتمع 
المستهدف هو عادة مجموعة dus‏ من العلماء أو المتخصصين قي مجال السياسات الذين 
لديهم فى العادة اختياجات مخددة تماما من البيانات. ومتظلبات وظيفية وغم هما يعنى 
أن حلول الأرشفة العامة ستكون ذات فائدة محدودة )2013 (Lauriault et al.‏ 

ومن ثم» فإن محفوظات البيانات ليست مجرد مخازن بيانات أو أنظمة نسخ احتياطي 
(والتي تحفظ البيانات في حال حدوث أعطال على المدى القصير مثل عطل الوسط التخزيني 
أو الفشل التقني). ولكنها ehhis‏ وتنسّقء وثدارء وثوظف dlei‏ من قبل موظفين 
متفرغين ومتخصصين يعملون على إضافة القيمة وضمان الاستمرارية. فهؤلاء الأفراد. إضافة 
إلى الكيان الإداري الوظيفي» مسؤولون عن الأرشفة إضافة إلى ثلاث مجموعات أخرى من 
الأطراف الفاعله idae à‏ الأرشفة وهم: منتجو البيانات» ومستهلكو البيانات» والإدارة 
.(CCSDS 2012)‏ فالمنتجون هم منشئو البيانات أو GPI OLII‏ المسؤول عن إنتاجها؛ 
Ul‏ المستهلكون فهم مستخدمو المحفوظات: وأصحاب المصلحة المعنيون بها أو مجتمع معين؛ 
Lala‏ الإدارة نبي الهيئة التي تشرف على العمليةء .$939 للأرشف مىثاقا ونطاقاء ولكنها لا 
تأخذ 1593 ذش à là‏ عمليات الأرشفة اليومية )2013 (CCSDS 2012; Lauriault et al.‏ 
وتشكل هذه الدوائر مجتمعة كيفية بناء وتشغيل وتطوير الأرشيف مع مرور الوقت. 
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في اطمقابل» فإن حاويات البيانات هو مجموعة غير رسمية وغير نظامية من البيانات. 
وقد يعتد بعض منتجي البيانات أن النسخ الاحتياطي أو أنظمة التخزين تشكل محفوظات 
أرشيفية بحكم الواقع» ولكنها تفتقر إلى الجهاز المؤسسي.ء والتنظيم» والسياسات الرسمية 
النظامية (بالنسبة إلى المعاييرء وإتاحة الوصول إليهاء وإمكانية إعادة استخدامهاء وحقوق 
ا ملكية الفكريةء والمعايير الأخلاقية: وإلى 6,2( وما يطمح إلى تحقيقه الأرشيف Lauriault)‏ 
.(etal. 3‏ فقد تكون حاويات السانات منتظمة وموخهة» ولكن بدون قواعد صارمة 
أو أي خطط طويلة المدى تتعلق بالمحافظة على البيانات وحفظهاء ودون أي ell‏ لمشاركة 
البيانات وتبادلها أو جعلها متاحة لإعادة الاستخدام. وعلى الرغم من أن حاويات البيانات 
قد تلتزم بشكل جيد بمعايير البيانات المتوقعة: إلا أن هذا الالتزام يفتقر إلى الاعتماد 
والمصادقة عليه ويفتقر إلى الوثائق الأخرى والبيانات الوصفية المناسبة. 

وقد فقدت معظم البيانات التي 63 إنتاجها على مر التاريخ أو Ca»‏ بسبب تخزينها 
ف حاويات بيانات] dà. 3] uade‏ أوالأنه تقرر الحفاظ عاى'اللعلومات المستقاة من هذه 
البيانات (مثل المقالات والكتب) التي كانت تعد «das. XS]‏ وتخزينها في اممكتبات. وبشكل 
e Le‏ تم الإبقاء فقط على مجموعات البيانات الأكثر das‏ مثل تلك ال مرتبطة بالمساعي 
العلمية والثقافية الأساسية والسجلات الحكومية: وا معاملات الاقتصادية: والعقود القانونية. 
s‏ حالات النماذج: الفنون الكائنات ....إلخ والتي يمكن اعتبارها صورا معينة من البيانات 
فقد تم تنسيقها وتخزينها بالأماس في المتاحف وصالات العرض جنبا إلى جنب مع البيانات 
الوصفية ال مرتبطة بها. وقد تم تخزين البيانات الخاصة معظم العلماء بشكل غير رسمي 
على ملفات وصناديق أو على مختلف محركات الأقراص الصلبة في مكاتبهم أو في منازلهم. 
وعندما يتقاعدون خارج الخدمة أو يتوفون يتم تدمير معظم آثارهم» ومعهم أي بيانات 
قاموا بإنتاجها. كما أن الغالبية العظمى من البيانات التي تمّ إنتاجها لأطروحات الدكتوراه 
تفقد بعد الانتهاء dgio‏ وغالباً لا يتم نشر حتى المعلومات المستقاة من البحوث. وعلاوة 
على ذلكء Yas OB‏ البحوث تاريخيا لم يطالبوا المشاريع التي قاموا بتمويلها بحفظ 
البيانات وتخزينهاء أو إن طلبوا ذلك فقد كان لفترة قصيرة من الزمن. وكما هو الحال في 
العديد من ال مشاريع التي se‏ الاتحاد الأوروبيء يشترط الاحتفاظ بجميع مواد ال مشروع 
مما قي ذلك البيانات مدة سبع سنوات» ولكن يمكن بعد ذلك التخلص منهاء وهو ما يتم ف 
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كثير من الحالات» بسبب تكاليف التخزين والظن الغالب بأن المقالات الورقية الناتجة تمثّل 
قيمة أكير. 

ومع تطور حلول التخزين الرقميء التي قللت التكلفة والمساحة التخزينية للاحتفاظ 
بالساناتء فقد بدأ التخزين الطويل الأمد على نطاق واسع للبيانات الاعتيادية المنخفضة 
التكلفة (انظر الفصل الخامس). فقد ظهرت أولى قواعد البيانات الرقمية التي ضمت 
مجموعات البيانات في الخمسينيات والستينيات من القرن الماضي وكانت تنسق البيانات 
فى هياكل مسطحة أو هرمية منظمة )2012 .(Driscoll‏ ومع ذلك» فقد كانت هذه 
الترتيبات غير فعالة للبحث والاستعلام عن البيانات» كما تم تطوير قواعد البيانات العلائقية 
(Relational databases)‏ ابتداء في عام ۱۹۷۰ من قبل إدغار كود (Edgar Codd)‏ وقد 
نظم خصائص البيانات المميزة (Attribute)‏ في مجموعة من الجداول ال مترابطةء حيث يتشارك كل 
جدول بحقل بيانات واحد على الأقل مع جدول آخرء فعلى سبيل ال مثال: قد يكون رقم الضمان 
الاجتماعي هو الحقل مشترك بين جدولين (المفتاح التأشير $" (Indexical Key‏ أحدهما $9209 
على التفاصيل الشخصية (مثل العمرء الجنس: الحالة الاجتماعية: والعنوان) ويحتوي الجدول 
الآخر على المتعلقات «JUL‏ ويسمح رقم الضمان الاجتماعي بربط البيانات للاستعلام في 

كلا الجدولين - وإنتاج بيانات جديدة مشتقة منهما. وإذا كان امفتاح المشترك bla:‏ 
Asus sl‏ فيمكن عنذها وضع البيانات l bag‏ لفق كنك فاع انات 
العلائقىة تنظيما واستعلاما أكثر فعالية وتعقيدا عن البيانات الهيكلية باستخدام لغات 
الاستعلام الفبكلة (SQL)‏ وجننا إلى جنب مع قواعد البيانات العلائقيةء سمح تطوير 
البيانات المجدولة (Spreadsheets)‏ بتنظيم وتخزين كميات كبيرة من البيانات الحسابية 
إضافة لتطبيق الصيغ وا معادلات عليها مما يؤدي إلى إنتاج بيانات مستقاة جديدة. وقد 
استكملت هذه الأشكال من قواعد البيانات» في السنوات الأخيرةء بقواعد البيانات غير 
الهيكلية Yo)‏ استعلام (-noSQL.‏ التي يمكنها التعامل مع كميات كبيرة من البيانات غير 
الهيكلية (انظر الفصل الخامس). 

كوخ Lad‏ دوفو cool abs aaa‏ سيلا في الحالات التي تنتج فيها البيانات ابتداء 
بصورة رقمية (نشأت بالكود bih (binary code-,3L JI‏ بطرق Adip gog LS‏ كما 
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O'Carroll عرضة للخسارة بشكل كبير بسبب التقادم في البرمجيات وال معدات. وقد بين‎ re 
والنظر‎ diw dio قبل‎ S أحد التقاط كتاب‎ SY أنه: «في حين يمكن‎ and Webb (2012) 
فيه» وقراءة صفحة منه» فإنه لن يكون ذلك بالمثل صحيحا لقرص مرن يحتوي على ملفات‎ 
سنة فقط». وف المقابل» ينبغي أن تحوّل‎ ٠١ لبرمجيات وورد بيرفكت أنشئت قبل‎ dca 
uo «JU Law الأشكال التناظرية/ التمائلية للسانات إلى الصورة الرقمية الثنائية على‎ 
طويلا‎ bög ضوئيا أو إعادة تسجيلها وإدخالهاء والتي يمكن أن تكون مكلفة وتستغرق‎ 
الى حد ما. وقد حدت التكاليف والنفقات‎ Ui على الرغم من إمكانية أتمتة هذه العملية‎ 
من حيث التكلفة المادية: وقت ال موظفينء, وا معدات‎ (Digitisation) امرتبطة بالرقمنة‎ 
المتخصصهة. من تطبيقها في العديد من المحفوظات الأرشيفية التناظرية التي تحتفظ بها‎ 
لتمؤيل‎ Lus odas المتاحف واكاك الخموعات الشخصية الخاضة. ودننها كافحت‎ 
(http://archive.org) أنشطة الرقمنةء فإن جهات خيرية غير ربحية مغل أرشيف الإنترنت‎ 
هذه الأنشطة وذلك باستخدام‎ Jie تساعد على القيام‎ (Google) وتجارية مثل قوقل‎ 
جانا للجميع‎ dle مواردهننا الذاتية أو تبزعات المحسنين من.عافة الأفراد مما يجعلهنا‎ 
(انظر الفصل الخامس).‎ 

وف جميع الحالات» فإن البيانات ضمن حاويات البيانات الرقمية والمحفوظات الأرشيفية 
مكن مشاركتها وإعادة استخدامها بسهولة وبتكلفة هامشية منخفضة: وذلك على الرغم 
من أنه من الممكن الحدّ فيما يتعلق بالوصول وإعادة الاستخدام بواسطة سياسات حقوق 
à SUI‏ الفكرية. وعلاوة على ذلكء فإنه من الممكن معالجتها وتحليلها من خلال الأدوات 
الحسابية القويةء إذ أصبحت الإجراءات والحسابات التي كان من الصعب القيام بها يدويا 
أو باستخدام التقنيات التناظرية على سبيل JELI‏ المسطرة الحاسبة التناظرية Slide)‏ 
(rules‏ ممكنة في غضون بضعة أجزاء من الثانيةء وأكثر في بناء واختبار النماذج وأنظمة 
المحاكاة المعقدة. كما نكن colsgle- Ja; Laol‏ الات الرقىة والمحعفوظات اة ا 
بسهولة نسبيا ومدّها إلى أشكال أخرى من البنى التحتية للبيانات. 


فالبنية التحتية للبيانات هي الوسيلة المؤسسية والمادية والرقمية لتخزين وتبادل 
واستهلاك البيانات عبر التقنيات ال مرتبطة بعضها ببعضء وعلى مدى العقدين الماضيين على 
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وجه الخصوصء فقد تم بذل جهد uS‏ لتطوير وتعزيز هذه البنى التحتية» والتي isb‏ 
عدة أشكال: الكتالوجات» والأدلة: والبوابات» ومراكز Jols‏ المعلومات» والمستودعات: 
وا مستودعات الرقمية الموثوقة. والبنى التحتية السيرانية Cyber-Infrastructures)‏ 
.(Lauriault et al. 2007‏ وغالنا ما تستخدم هذه ال مصطلحات بالتبادل ويجري الخلط 
بعضها ببعضء وذلك على e£ JI‏ من Uil‏ تمثل أنواع مختلفة من الكيانات (انظر الجدول 
2-2 على سيل المثال). 

فالكتالوجات» Hlg‏ والبوابات هي موارد مركزية تفصّل وتربط حاويات البيانات 
والمحفوظات الأرشيفية التي تحتفظ بها المؤسسات على المستوى الفردي. وقد توفر قوائم 
مفصلة إلى i>‏ ما عن مجموعات البيانات التي تضمّهاء كما هكن أن تكون بمثابة مجاميع 
OLLU‏ الوصفيةء ولكن لا يستضيف اموقع نفسه البيانات )2013 (O'Carroll et al.‏ 
lol‏ مستودع البيانات أو مركز JILI‏ المعلومات فهو مكان مشترك لتخزين حاويات البيانات 
وا محفوظات الأرشيفية والوضول إليها. وقد توفر هذه ال مستودعات وا مراكز بعض خدمات 
البيانات من قبيل البحث والاسترجاع: وإدارة البيانات ومعالجتهاء ولكن عملية إنتاج كل 
حاوية 9l‏ أرشيف تتم بشكل مستقلء ولذا فهي رها تفتقر إلى صيغ ومعايير وبيانات وصفية 
وسياسات مشتركة للبيانات. ومع US‏ يسعى مستودع البيانات لضمان التزام كل أرشيف 
أو حاوية igang‏ من المؤاصفات المطلوبة dino AU eo ig‏ والتدقيق» والتصديق على 
منح الشهادات لضمان سلامة البيانات وتعزيز الثقة بين المستخدمين )2012 (Dasish‏ 
وعرف )2013( O Carroll et al.‏ نوعين من ال مستوعات. مستودعات اموقع الواحد التي 
تستضيف كافة مجموعات البيانات في موقع واحد» 5S es‏ الوصول إليها من خلال واجهة 
على شبكة الإنترنت» على الرغم من إمكانية احتفاظها بنسخ احتياطية أو مواقع مثيلة في 
أماكن متعددة. والمستوعات ال متعددة المواقع التي تستضيف البيانات ضمن هيكل موحد 
يسمح بالوصول إلى مجموعات البيانات القائمة في عدد من المواقع المؤسسية. 

فالمستوع الرقمي الموتوق (TDR - Trusted Digital Repository)‏ هو مستودع 
مرخص بموقع واحد أو متعدد المواقع diago Jia‏ في توفير وصول آمن وموثوق به 
للبيانات التي يديرها على المدى البعيد )2002 .(RLG and OCLC‏ ومن اجل التاهل 
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كمستودع 39355( فصلت )5 :2002( RLG and OCLC‏ الخصائص ال مطلوب توفرها في 
البنية التحتية لهذه ال مستودعات وهي كالتالي: 
٠‏ تقبل المسئولية عن الصيانة طويلة الأمد للموارد الرقمية بالنيابة عن ا مودعينء وما فيه 
مصلحة المستخدمين الحاليين والمستقبليين: وال مستهلكين أو ا مجتمعات ال معنية. 
البعيد. ولكن يحافظ أيضا على المعلومات الرقمية التي تقع ضمن نطاق مسؤوليته. 
o‏ توضيح المسؤولية الماليه وضمان الاستدامة. 
o‏ تصميم أنظمتها وفقا للاتفاقيات والمعايير المقبولة والمعتمدة لضمان الإدارة المستمرة, 
«Jo 9Jls‏ وأمن المواد امودعة داخلها. 
٠‏ وضع منهجيات لتقييم المستودع. وذلك للتأكد من تلبيته للتوقعات المجتمع من حيث 
الموثوقية. 
o‏ إمكانية الاعتماد على البنية التحتية الخاصة بها وضمان تحمل مسؤوناتها على ال مدى 
الطويل تجاه ا مودعين والمستخدمين بشكل علني وصريح. 
« امتلاك السسراسات» والممارسات» والأداء الذي مكن تدقىقه وقباسه. 
ولي يمكن لمستودع ما الحصول على هذه المتطلبات» أكدت RLG and OCLC‏ 
)13 :2002( أنه ينبغي أن يكون متوافقا مع النموذج امرجعي لنظام المعلومات الأرشيفي 
امفتوح )2012 (OAIS Open Archival Information System-)(CCSDS‏ وآن متلك 
وأمن النظام: والمساءلة الإجرائيةء وتساعد كل هذه الخصائص معا على ضمان وبناء الثقة 
à‏ السانات ومستودعها. 
وقلا ER‏ التحعبة السيراتنة 1 من محرة مجموعة من ايلحقُوظآت لأر فة 
ا موثوقة فهي تمكن من تبادل البيانات والتشارك في موارد البنية التحتية باهظة الثمن. 
وتتألف البنية التحتية السيرانية من مجموعة متكاملة من المعدات ال متخصصة والتقنيات 
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الشبكية (تشمل المراصد وال مرافق البحشة التجريسة: وشبكات الاستشعارء وما إلى ذلك)» 
والخدمات والأدوات لرمجبات التشغيل ال متبادل والبرمجيات الوسيطة؛ والخدمات ال مشتركة 
(المتعلقة بإدارة البيانات ومعالجتها)ء وأدوات التحليل Jio‏ التمثيل البصرى للبيانات 
(على سبيل «JUL‏ تطبيقات الرسوم البيانية ورسم الخرائط).: والسياسات المشتركة (فيما 
يتعلق بحق الوصول للبيانات واستخدامها وحقوق الملكية الفكريةء وغيرها) التي تمكن 
من نشر البيانات وتوزيعهاء وربطها بعضها مع بعض وتحليلها dia)‏ البنية التحتية 
السيبرانية 2007 .(Cyberinfrastructure Council‏ كما تسعى إلى تعزيز dead‏ ال مجتمع 
الثقاف الذي يدعم التعاون المباشر بين الأفراد متجاوزا الحدود الجغرافية وا مؤسسية 
los .(Cyberinfrastructure Council 2007)‏ تستخدم ülal‏ لوصف daxil dadl‏ 
التي تمكن عمل مستودع بيانات ose‏ فإنها تستخدم هنا للدلالة على البنية التحتية 
للبيانات التي تتشارك في مواصفات تقنية مشتركة متعلقة بالنماذج: والمعايير: والبروتوكولات. 
وبعبارة 5,21« هناك قواعد صارمة متعلقة بتطبيق المعايير على البيانات والالتزام بها داخل 
البنية التحتية. وتشمل مثل هذه البنى التحتية السيبرانية تلك التي تنفذها الوكالات 
الإحصائية الوطنية والبنى التحتية ال مكانية الوطنية OLLU‏ إضافة إلى البنى التحتية 
العلمية واسعة النطاق التي تتعلق بأبحاث الجينات» وعلم الفلكء والأرصاد الجوية وغيرهاء 
والتي تتطلب تخزين كافة البيانات ومشاركتها مع الامتثال لمعايير محددة من أجل تحقيق 
أقصى قدر من قابلية التشغيل البيني للبيانات وضمان جودة البيانات» والإخلاص والنزاهة 
التي تعزز الثقة. وهذه الأخيرة لها أهمية خاصة في مجال العلوم» والسياسات التي تقوم 
على أساسها مثل تتبّع تغيرات المناخ وتنبؤاته» حيث تعد سلامة البيانات أمرا بالغ الأهمية 
في المناقشات الجارية حاليا. 

وإضافة إلى بوابات البيانات» وا ملستودعات. والبنى التحتيهء تم استحدات عدد من 
المنظمات والهياكل المؤسسية التي تقدم المشورة بشأن أفضل الممارسات في مجال الحفظ 
الرقمي» وإتاحة ومشاركة البيانات» والتحقق من صحة العمل واطعايير المتعلقة بالأنواع 
امختلفة من بنوك البيانات» والدفع باتجاه تنميتها وتطويرهاء وتنسيق الجهود المختلفة 
olis‏ ذلك (انظر الجدول 2-3). وتؤدي هذه المنظمات والهياكل المؤسسية عملها من خلال 
أنشطة عدة Jio‏ تقديم البرامج التدريبية والتعليمية: واستضافة الندوات والمؤتمرات» وإنتاج 
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الكتيبات والآدلة وتوفير التمويل اللازم لمبادرات محددة. وتكتسب هذه المنظمات "WAS‏ 
نظرا لإسهاماتها في خلق مجتمعات الممارسة بين مختصي البيانات» وتسهيل المفاوضات بين 
الهيئات وتوسيع نطاق الجهود اممؤسسيهة»ء ووضع مبادئ توجيهية ومعايير مشتركة. ويركز 
بقية هذا القسم على مستودعات البيانات البحثية والبنى التحتية: ويفصل في الأسس 
المنطقية لها والتحديات التي تواجههاء كما ستتم مناقشة البنى التحتية الخاصة والمتعلقة 
بشركات البيانات التجارية في وقت لاحق ف هذا الفصل. 
جدول رقم (Y-Y)‏ 
أنواع وأمثلة البنى التحتية للبيانات 


النوع الأمثلة 


يطلق على مجموعات غير رسمية من ملفات البيانات التي تكون على جهاز حاسب 


حاوية الببانات Data Holding‏ 
شخصيء ويسمى نظام النسخ الاحتياطي في بعض الأوقات. 








أرشيف لونی لبيانات الصور (LONI Image Data Archive-IDA)‏ هو أرشيف 
في جميع أنحاء القارة الأمريكية الشمالية والقارة الأوروبية. 


محفوظ السانات 







(أرشيف السانات) Data‏ 
Archive‏ 
أرشيف الموسيقى ALI‏ الموجوذ في مكتبة موسيقا لويب (Loeb)‏ في جامعة 
هارفارد الذي يقدّم تخزينا آمنا ووصولا متاحا لمحتوى الأرشيف والتسجيلات 
التجارية الصوتية والمرئية للموسيقى من جميع أنحاء العام. 





الكتالوجات» NI‏ البوابات» | تمكن خدمة البيانات الوطنية الأسترالية المستخدمين من تصفح أكثر من أربعمائة ألف 
البيانات diog‏ وا مجمّعون | من مجموعات البيانات وأكثر من ثلانمائة ألف مشروع تقوم بإنشاء مجموعات البيانات. 


Catalogues , Directories‏ | تتيح dz tI‏ الرقمية العامة الأمر يكية الوصول إلى مليونين وخمسمائة آلف سجل من 
Portals , Metadata ,‏ , سجلات السانات الوصفية من مكتبات» ومحفوظات» ومتاحف مقرها الولايات المتحدة. 


"P pA E حي‎ à 2 : Aggregators 
وثلاثين من‎ dis إلكترونية ومجمّع للبيانات الوصفية لأكثر من‎ doles يوروبيانا هي‎ dis 


المكتبات والمتاحف وال مكتبات الرقمية للوسائط المتعددة في جميع أنحاء أوروبا. 


محفوظات بيانات المجلس الأوروبي للعلوم الاجتماعية (CESSDA)‏ هى 
بوابة إلكترونية ومجمّع للبيانات الوصفية منذ ما يزيد عن ثلاث وعشرين سنة 
لمستودعات البيانات الأوروبية الإحصائية للعلوم الاجتماعية التي تضم أكثر من 
ثمانية وعشرين ألف من مجموعات البيانات. 
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خدمات أرشفة وشبكات البيانات (DANS)‏ هو الأرشيف الوطني الهولندي 
لبيانات البحوث الرقمية. إضافة للأرشفة. وتقذه المبادئ التوجيهية للتدريب 
والاعتماد. 


أرشيف بيانات المملكة المتحدة (UKDA)‏ هو مستودع بيانات الموقع الواحد 
لبيانات بحوث العلوم الاجتماعية والإنسانية الممولة من قبل مجلس البحوث 
الاقتصادية والاجتماعية (ESRC)‏ ولجنة نظم المعلومات المشتركة (JISC)‏ 
وجامعة إسيكس (Essex)‏ 


المستودع الرقمي الايرلندي (DRI)‏ هو مستودع رقمي موثوق للبيانات 
المعاصرة والتاريخية» الاجتماعية والثقافيةء وتقوم عليه المؤسسات الأيرلنديةء 
ويوفر إتاحة الوصول: والحفاظ de‏ البيانات للجهات المعنية ذات المضلحة 
واكتشافها. 


أوبونير (Openaire)‏ هو مستودع رقمي متعدد المواقع للحصول على البيانات 
العلمية المفتوحة في منطقة البحث الأوروبية المكونة من واحد وأربعين منظمة 
وثلاثة ونلاتين بلدا WM‏ 

التي توفر منصة وخدمات مشتركة لتوفير الوصول المفتوح للبيانات والحفاظ 
عليها. 


توفر البنية التحتبة للسانات الجغرافية المكانية الكنذية (CGDI)‏ 
ا مكانية عير القطاعات والنطاقات الكندية. 





الفصل الثاني 


مستودعات سانات اموقع 
الواحد 


Single-site Repositories 


مستودعات (blo‏ متعددة 
المواقع 


Multi-site Repositories 


البنى التحتية السيبرانية 


Cyber- Infrasrtuctures 


المصدر : مقس بتصرف من -O'Carroll et a!.(2013)‏ 
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جدول (Y-Y)‏ 
مجموعة منتقاة من مؤسسات تقديم المشورة, والضغط لكسب cold!‏ والتنسيق للمحافظة على 
البيانات وإتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم الاجتماعية والإنسانية 


The Federation of All European www.allea.org اتحاد جميع الأكادميات‎ 
(Academies (ALLEA الأوروسة‎ 


المحفوظات الصوتية www.bisa-web.org‏ 
البريطانية والايرلندية 





British and Irish Sound Archives 
((BISA 








Consortium of European Social Science www.cessda.org 


Data Archives 


الاتحاد الأوروبي لمحفوظات 
البيانات للعلوم الاجتماعية 





(Coalition for Networked Information (CNI www.cni.org التحالف من أجل معلومات‎ 


مارا( 


Common Language Resources and www.clarin.eu doula موارد اللغة المشتركة‎ 
(Technology Infrastructure (CLARIN التحتية التقنية‎ 





Committee on Data for Science and www.codata.org البيانات للعلوم‎ dio 
للعلوع‎ 


Digital Services Infrastructure for Social www.dasish.eu الخدمات الرقمية للبنية التحترة‎ 
(Sciences and Humanities (DASISH للعلوم الاجتماعية والإنسانيه‎ 


EET ETE Woven 
(Digital Library Federation (DLE www.diglib.org اتحاد المكتبة الرقمية‎ 
(Digital Preservation Coalition (DPC www.dpconline.org تحالف الحفظ الرقمى‎ 


(Digital Production Partnership (DPP للإنتاج الرقمي‎ 451 2JI 


Technology of the International 


Council for Science 








digitalproductionpartnership. 





co.uk 
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الفصل الثاني 


International Federation of Television www.fiatifta.org الاتحاد الدولي المحفوظات‎ 
(Archives (FIAT/IFTA Os» 5ALJI 


International Association for Social www.iassistdata.org الرابطة الدوليهة لخدمات‎ 
Science Information Services and ملعلومات والتكنولوجا‎ Ll 
(Technology (IASSIST للعلوم الاجتماعيه‎ 


International Association of Sound and www.iasa-web.org الرابطة الدولىة‎ 
والسمعية - البصرية‎ 





Audiovisual Archives 








Inter-university Consortium for www.icpsr.umich.eda/ 


(Political and Social Research (ICPSR icpsrweb/ICPSR 


!355 الجامعات للىحوث 
السياسية والاجتماعية 
شبكة الخبرة في التخزين 
على الدى الطويل للموارد 


الرقمية 


مؤسسة الكواكب المفتوحة 


org 


.(O' Carroll et al. (2013 امصدر : مقتىس بتصرف من‎ 


Network of Expertise in Long-term | www.langzeitarchivierung.de/ 
(Storage of Digital Resources (NESTOR | /Subsites/nestor/DE/Home 














Open Planets Foundation www.openplanetsfoundation. 


الأسس المنطقية OGLU daxil GU‏ البحشة: 
بالنظر إلى أن بناء البنى التحتية للبيانات هي ممارسة ليست باليسيرة» ومكلفة من حيث 
الموارد والوقت الذي يستلزمه إنشاؤها والمحافظة عليها بشكل مستمرء فينبغي أن تكون 
هناك أسباب معتبرة لإجراء مثل هذا المسعى والمضي فيه. ويستعرض الجدول (Y-€)‏ قائمة 
لأكثر من ثلاثين من هذه الأسباب مقسمة على G‏ أبعاد - مباشرة / وغير مباشرةء وفي المدى 
القريب / وعلى اطدى البعيد.ء والعامة / والخاصة بحسب تعريف )2010( .Beagrie et al.‏ 
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السانات الصغيرة: والبنى التحتبة للسانات» ووسطاء السانات 


Se‏ أن تترجم هذه الأسباب تقريبيا إلى المكاسب العلمية والمالية» والتأثير التراكمي للفوائد. 
وامستفيدين من هذه البنى التحتية. 

وتتمحور المناقشات والحجج العلميه لتخزين» ومشاركة. وتوسيع البيانات داخل البنى 
التحتية للبيانات حول وعود من الاكتشافات والابتكارات الجديدة من خلال الجمع بين 
مجموعات البيانات والتوظيف الجماعي للعقول المشاركة. فمجموعات البيانات الفردية 
ذات قيمة في Xo‏ ذاتهاء ولكن عند ضمّها جنبا إلى جنب مع مجموعات بيانات أخرى 
أو تفحصّها بطرق وأساليب جديدة: فإن رؤى وأفكار جديدة من ال محتمل أن تظهر 
وأسئلة جديذة من الممكن أن تتم الإجابة (Borgman 2007) le‏ فبسبب الطبيعة 
التراكمية» من خلال الجمع بين مجموعات OLLI‏ يمكن الزعم بتسارع وتيرة بناء المعرفة 
.(Lauriault et al. 2007)‏ وعلاوة على ذلك» يصبح من الممكن من خلال الحفاظ على 
البيانات تتبع الاتجاهات والأنماط مع مرور الوقتء وكلما ازدادت 833 التسجيل OLLU‏ 
زادت معها القدرة على بناء النماذج وأنظمة المحاكاة ومن ثم زيادة الثقة في الاستنتاجات 
التي يتم التوصل إليها )2007 J .(Lauriault et al.‏ فإنه ومع مرور الوقت» تزداد 
القيمة التراكمية لمستودعات البيانات والبنى التحتية بحيث تصبح البيانات متاحة على 
نطاق واسع وبشكل أكثر يسراء وذلك من حيث النطاق والصلاحية الزمانية. 

ومن المرجح أن تعمل هذه المشاركة الاستراتيجية إلى بث روح التعاون بين الباحثين والفرق 
في التخصصات الجديدة: وتعزيز المهارات بصورة أكبر من خلال إمكانية الوصول إلى أنواع 
جديدة من السانات )2007 .(Borgman‏ وعلاوة على US‏ فإن Jols‏ اطعلومات واعتماد 
معايير وبروتوكولات وسياسات البنية التحتية من شأنه أن يرفع من مستوى جودة البيانات 
وأن يفسح الممجال لأطراف أخرى لإنتاج بيانات مشتقة والتحقق من البيانات المتاحة» ومن 
ثم زيادة سلامة البيانات )2007 .(Lauriault et al.‏ كما تعمل البنى التحتية e lal‏ 
إتاحة بيانات عالية الجودة في التعليم وتحسين المصادر التربوية والتعليمية لتدريب الجيل 
القادم من الباحثين. كما أن البنى التحتية للبيانات هي الوسيلة الوحيدة لإدارة البيانات 
والمشاريع بكفاءة وفعالية في الحالات التي تعتمد فيها المشاريع العلمية بشكل كبير على 
أدوات تقنية ال معلومات والاتصالات الباهظة الثمن» والتي ينتج عنها كميات هائلة من 


ثورة البيانات البيانات الكبيرةء والبيانات اممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها V4‏ 





ANZ 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الثاني 


البيانات» وكذلك في المشاريع التى تضم فرقا بأعداد كبيرة من الباحثين المنتشرين في جميع 
أنحاء العام لتحليل هذه البيانات» لذا فإن البنى التحتية للبيانات تمثل الوسيلة الوحيدة 
الفاعلة والفعالة لإدارة مثل هذه النوعية من البيانات والمشاريع )2007 (Borgman‏ 


وتتمحور الفوائد JUI‏ للبنى التحتية للبيانات حول الموازيين الاقتصادية التي تنشأ 
من خلال تقاسم الموارد ومشاركتها وتجنب تكرارهاء والآثار المترتبة على إعادة الاستخدام 
للبيانات ال مكلفة. والثروة الناتجة من خلال الاكتشافات amsol‏ وإنتاج مجتمعات 
isi‏ كفاءة. فالبحث عملية مكلفة في العادة. حيث تنفق وكالات التمويل ال مختلفة 
بشكل جماعي مليارات الدولارات سنويا لتمويل النشاط البحثي. وينطوي جزء كبير من 
هذا النشاط على ازدواجية غير ضرورية في جهود إنتاج البيانات» ومعالجتهاء وإدارتهاء 
وتحليلها. وبدلا من إنشاء عدد كبير من المحفوظات الأرشيفية الخاصة؛ فإنه من المنطقي 
إنشاء عدد أقل من البنى التحتية المخصصة التي تقوم بتقديم وتحضير البيانات الأساسية 
على صورة $3792 وتنتج فعالية كبيرة في الجهد. وتمكن كذلك وصولا أوسع للبيانات 
للأفراد الباحثين والمؤسسات كون تكاليف الدخول إلى حقل أو مجال بحثي في العادة 
باهظة )2008 .(Fry et al.‏ وإضافة إلى ذلك. ستصبح عمليات ونتائج المشاريع البحثية 
أكثر شفافية ويمكن الحكم على مدى تمثيلها القيمة مقابل JLL‏ وفضلا عن Jodl‏ من 
الهدر والحفاظ على الثمار الناتجة من هذه الجهود وتقاسمهاء فإنها ستعمل على تعظيم 
العائد من الاستثمار من خلال تمكين أكبر قدر من المكاسب التي يمكن الحصول عليها من 
البيانات )2007 .(Lauriault et al.‏ فعلى سبيل JULI‏ قد ينتج عن dobl‏ البيانات على 
نطاق واسع صناعات جديدة قائمة على ال معرفة وتكون شركات منبثقة ومنفصلة من خلال 
تسويق البحوث الممولة من القطاع العام (ائتلاف العلوم 2013 (Science Coalition‏ 
كما يمكن للبيانات ضمن البنى التحتية للبيانات أن تؤدي إلى طرق أكثر فعالية في الحوكمة 
والإدارة ال مجتمعية. على سسيل JEBI‏ توفر العديد من البنى التحتية للبيانات ال مكانية 
الوطنية. إضافة إلى دعمها للبحوث AAAI‏ آدوات فعالة للإدارة والحكومة الإقليمية: 
وتمكن من الاستعداد للطوارئ والاستجابة للكوارث بصورة أكثر فعاليةء وتسهيل التخطيط 
بين الدول. 
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وبحسب ما تم إيضاحه من خلال النقاش حتى الآن» فإن الفوائد ال محتملة المكتسبة 
من البنى التحتية للبيانات هى فوائد ممتدة وغير محصورة بالقطاع العام أو الخاص 
.(Beagrie et al. 2010)‏ وقد ظهر جليا ف الواقع ان استراتيجية مشاركة البيانات 
وتقاسمها تعود بالفائدة على جميع الأطراف - الباحثينء ا مؤسسات» ال ممولين» والمؤسسات 
العامة والخاصة. فعلى مدى العقدين الماضيينء وبالنظر إلى المكاسي المتوقعة من مشاركة 
البيانات وتبادلهاء عملت الوكالات البحثية للحكومات الوطنية والهيئات الإقليمية مثل 
الاتحاد الأوروبي. جنبا إلى جنب مع المنظمات الخيرية» على الاستثمار بنطاق واسع في تمويل 
مجموعة كبيرة من المبادرات ا مختلفة. ومع eUS‏ وكما هو مبين olol‏ فهناك مقاومة Jih‏ 
هده المشاريع» des‏ الأخص من قبل الباحثين أنفسهم» ومن الواضح أنه على الرغم من 
أن هناك فوائد لا شك فيهاء فهناك Lal‏ تكاليف مرتبطة بإنشاء البنى التحتية للبيانات. 


تحديات بناء البنى التحتية للسانات: 

عاى الرغم من الفوائد المتوقعة والمُدركة من البنى التحتية anu‏ إلا أنها لم تلق 
ترحيباً elle‏ كما أنها أثبتت igro‏ بنائها n ris‏ فهناك مجموعتين رئيسيتين من 
القضايا الفاعلة - التقنية والاجتماعية/ السياسية - التى تعوق تطوير البنى التحتية للبيانات 
وتنميتهاء وستواصل القيام بذلك لبعض الوقت. 


جدول رقم (Y-€£)‏ 
فوائد مستودعات البيانات والبنى التحتية للسيانات 
FETE a‏ 
ei‏ 


انخفاض تكاليف الم محافظة على البيانات في ا مستقبل. 








إعادة تحديد الأهداف وإعادة استخدام البيانات. 


زيادة الإنتاجية البحثية إعادة توظيف البيانات للمهتمين الجدد. 





تحفيز أنواع جديدة من التواصل / التعاون. إغادة توظيق المنهجنات البلستخدمة. 


inn pied cR 
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الفصل الثاني 
حي لمان عل الما ليك 


لنحسين قاعدة امهارات. الأدوات وا معابير نحتمل أن تزيد من مستوى جوده 
البيانات. 





زيادة الإنتاجية / النمو الاقتصادى. تقليل الاستفسارات العشوائية المتعلقة بالبيانات 


التشت من البحث / سلامة Casu!‏ 


"T—‏ پڪ ڪڪ 
فوائد على call‏ القريب الفواند على المدى الطويل 
قيمة للباحث والطلاب الحاليين. تأمين القيمة للباحثين والطلاب المستقبليين. 


وتطورها للحد الأقصدى. 








توسيع إتاحة الوصول حيث التكاليف الباهظة | زيادة سرعة البحث والوقت اللازم لإدراك آثاره. 
للباحثين / المؤسسات. 





إعادة الاستخدام على المدى القصير للبيانات المنسقة | يحفز الأسئلة البحثية الجديدة: وبخاصة المتعلقة 
| بالسسانات المرتبطة والمشتقة. 


S MENEENEEN 777 


.Beagrie et al. 2010; Fry et al 2008 امصدر:‎ 
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إن إنشاء duo‏ تحتية عاملة وقابلة للتشغيل اتال OLLU‏ ليس i bled‏ خاصة 
إذا كان النظام موثوقا ويقدّم مستويات مختلفة من إتاحة الوصول lolozel‏ على تعريف 
المستخدم وضمانات فيما يتعلق بمصدر البيانات وسلامتهاء ونزاهتهاء وصلاحيتهاء فذلك 
يتطلب lgl‏ مكثفا وواسع النطاق والموائمة بين منتجى البيانات ومالك ال لمحفوظات 
الأرشيفية فيما يتعلق بالتالي: 

e‏ إجراءات إنتاج البيانات. 

o‏ تماذج البيانات ومعايير البيانات. 

o‏ السيانات الوصفية والتوثيق. 

o‏ إجراءات تحضر وتنقية وإدخال البيانات. 

o‏ جودة السيانات وضمانها. 

e‏ سياسيات الحفاظ على البيانات» والتسخ الاحتياطي» والتدقيق عليها: 

o‏ البرمجيات واممعدات. 

o‏ أمن وحماية المعلومات. 


o‏ سياسات الوصولء ومنح التراخيص» والاستخداة, وإعادة الاستخدام. والخصوصية. 
والجوانب الأخلاقية. 

o‏ سياسة ALLI‏ وحقوق الطبع والنشرء وحقوق الملكية الفكرية. 

o‏ الترتيبات الإدارية واليات تنظيم الإدارة والحوكمة. 

boë o‏ البنية التحتية وخدماتها وإدارتها. 

(Borgmann 2007; Data Seal of Approval 2010; O Carroll and Webb 2012) 

فالبنية التحتية للبيانات لن تنجح إلا إذا كان لديها رؤية طويلة «Jo MI‏ وهناك التزام 
لإدارة امحتوى نيابة عن المودعين والمستخدمين وتحمل مسؤوليتهاء مع التطبيق التام 
لجميع العوامل المذكورة أعلاه بشكل فعال )2012 (O'Carroll and Webb‏ 
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فالقضايا التي تمت الإشارة إليها ليست مجرد قضايا تقنيةء ولكنها أيضا اجتماعية وسياسية 
ذلك لأنها تتطلب التفاوض والاتفاق على طريقة تصميمها واختيارها ومتطلبات إدارتها 
kil‏ بين العديد من الأطراف - «yell‏ والمصممينء والمبدعينء وامديرين «x&39llg‏ 
ومجموعات الضغط والتوجيه. والمساهمين وأصحاب المصالح الخاصة الأخرى - في سياق 
مختلف التعليمات» واللوائح» والقوانين المتعلقة بإنتاج» وتخزين» ومشاركة البيانات. ومن 
ثم فهي تتشكل بواسطة الأجندات الشخصية والشخصيات. والقيم ا مؤسسية» والالتزامات 
والوصايات» والثقافات» والهياكلء والعمليات» والتمويل» والقضايا الحكومية. والتبعيات 
الإجرائية حيث أنه بمجرد أن يبدأ المشروع في مسار معين. فسيكون من الصعب غالبا توجيهه 
في مسار مختلف كليا عنه )2007 .(Feenberg in Lauriault 2012; Lauriault et al.‏ 
كما يمكن أن يكون تجميع ومواءمة المحفوظات الأرشيفية المعتمدة على مسارات تقنية 
مختلفة عملية في غاية الصعوبة» وطويلة الأمدء ومكلفة لأنها تتطلب من تلك المشاريع 
إجراء تغييرات لتحديث بياناتها المتقادمة لتتوافق مع المواصفات المتفق عليها في الموانئمة 
.(Lauriault 2012)‏ وهذا هو السبب ف اعتماد العديد من ا مشاريع الأرشيفية على بنية 
مستودع البيانات بدلا من السعي لتصبح بنية تحتية إلكترونية/ سيبرانية. 

Los‏ بعد الصعوبات المتعلقة بإنشاء هياكل Jols‏ البيانات» إقناع أصحاب البيانات 
أنفسهم بتبادل سلعتهم الثمينة (بياناتهم): فهناك lua‏ أساسي في البحوث الأكادهية وهو 
إتاحة الوصول المفتوح؛ quise‏ أن جميع جوانب إنتاج المعرفة ينبغي أن تكون متاحة بحرية 
للآخرين لتفحصها ونقدها. وهذا المبدأ لم ass‏ به على النحو الأمثل أبداء إذ تختفى الأبحاث 
الآكادمية في الغالب خلف حواجز الأجور ويتردد الباحثون في مشاركة بياناتهم وتبدلها مع 
الآخرين. وكما أشار )2007( Borgman‏ فإن مشاركة البيانات وتبادلها شائع في عدد قليل 
من التخصصات مثل علم الفلك (Genomics) Sll ele (Astronomy)‏ وعلم السانات 
العمرانية بهيتتها الرقمية (Geomatics)‏ والتى تعتمد على فرق علمية كبيرة وموزعة جغرافيا؛ 
Lil‏ في التخصصات الأخرى فيجري ف أحيان نادرة مشاركة البيانات وقد لا تجري على الإطلاق. 
وقد خلصت Borgman‏ إلى أن «السر الصغير القذر» وراء تشجيع مشاركة البيانات» وتبادلها 
هو عدم التبادل لكثير من البيانات ف الواقع )1059 :2012 .(Borgman‏ وذلك لأن هناك 
عددا من المثبطات التي تحول دون تبادل البيانات ومنها: 
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ه عدم وجود مكافات للقيام رذلك. 
o‏ الجهد اللازم لإعداد وأرشفة البيانات. 
yañ o‏ الخرة واموارد والأدوات اللازمة لأرشفة السبانات. 
o‏ مخاوف من القدرة على استخراج قيمة من البيانات قبل الغيرء وذلك من حيث الأوراق 
العلمية وبراءات الاختراع» ونظرا للجهد المستثمر ف إنتاج البيانات. 
o‏ المخاوف بشأن الكيفية التى سيتم بها استخدام البيانات» خاصة إذا كانت تتعلق 
بأشخاصء أو كيف مكن أن يساء التعامل معها أو يساء تفسيرها. 
٠‏ المخاوف بشأن الاستفسارات بخصوص إنتاج البيانات والطلبات التي من شأنها أن 
٠‏ مخاوف من القضايا ا متعلقة بالكشف عن البيانات ونتائج البحوث التي يمكن تقويضها 
من خلال تفسيرات بديلة لنفس البيانات. 
. قضايا الملكية الفكرية. 
٠‏ الخوف أنه لن يتم استخدام البيانات» وبالتاليتشكل الأرشفة جهداضائعا. 
Borgman 2007, 2012; Strasser 2013)‏ (. 
فمن الواضح أن ضمان البيانات من خلال أرففتها لإعادة استخدامها مستقبلا سوف 
يتطلب d‏ من محرد انشاء اي السانات e w daoi J| iod‏ ذلك يتطلب 
Feadh Gas‏ فمن ls dol‏ و الحوافز i-e sio UJ Mert‏ أيداء dun‏ 
البيانات. مثل تشجيع الاقتباس والإسناد عند إعادة استخدام البيانات )2012 (Borgman‏ 
وتوفير الأموال الكافية لأرشفة البيانات ضمن جوائز المنح. ومن ناحية آخرىء بدأت وكالات 
الأبحاث في إجبار الباحثين على إيداع وتبادل البيانات» مع مراعاة الجوانب الأخلاقية وحقوق 
ا ملكية الفكرية» كشرط لتمويل البحوث. 
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وسطاء السانات والأسواق :(Data Brokers and Markets)‏ 
متلك القطاع الخاص دافعا مختلفا lao‏ لإنتاج وإعادة استخدام البيانات عن ذلك الذي 
عند الأكاديميين: فالبنى التحتية للبيانات البحثية تسعى لتحقيق الصالح العام من خلال 
إنشاء مشاعات للسانات لتسهيل وتشجيع تبادل البيانات وإعادة استخدامها. وف «Jalàll‏ 
يلتقظ ss aus‏ البيانات (يسفون bL]‏ مجمعي أو مختزلي أو بائعي البيانات) البيانات 
ويجمعونها معا ويعيدون تعبئتها (تحزمها) في البنى التحتية للبيانات التي يملكها القطاع 
الخاص لعرضها للإيجار (للاستخدام طمرة واحدة أو لاستخدامها تحت شروط الترخيص) 
أو إعادة البيع على أسس ربحية. وتشمل اللمنتجات قوائم العملاء/الزبائن ا محتملين 
الذين يستوفون معايير معينة (بما في ذلك تفاصيل مثل الأسماءء العناوينء أرقام الهاتف. 
وعناوين البريد الإلكتروني» وكذلك معلومات Jio‏ «الجنس.ء العمرء العرق» وجود الأطفالء 
الدخلء قيمة المنزلء ملكية بطاقة الائتمان» الوضع الاثتمانى: أنماط الشراء والهوايات»؛ 
(CIPPIC 2006: ii)‏ والتدقيق على الخلفية الأمنية»ء ومجموعة من منتجات البيانات 
المشتقة التي أضاف لها الوسطاء قيمة من خلال التكامل» ومنتجات تحليل البيانات 
التي تستخدم في معظم الأحوال لحملات الدعاية والتسويق ال مصغرة. وتقييم الجدارة 
الائتمانية والتصنيف الاجتماعي للأفراد» وتوفير خدمات البحث عن المفقودينء وتقديم 
تحليلات الأعمال ال مفصّلة )2006 .(CIPPIC‏ وفي حالة القوائم» فهي في معظمها مستأجرة 
وف كثير من الحالات لا يستلم المستأجر AEI‏ حيث يعمل مكتب خدمة كطرف ثالث 
على إعداد وإرسال البريد بالنيابة عنهم )2006 .(CIPPIC‏ وبالمثل: مع تحليلات البياناتء 

حيث يتلقى العملاء نتائج تحليل البيانات» وليس ذات البيانات الأساسية. 

إن عملىات اختزال السانات واعادة سعهاء وما Jap‏ بها من تحليل للسانات وخدمات 
ذات arua das‏ هي صناعة ارات الدولارات» مع كميات هائلة من البيانات وال معلومات 
المستمدة 7 تؤجرء وتباع» وتشتري بشكل يومي عبر مجموعة متنوعة من الأسواق - تجارة 
التجزئة: وا مالية:» والصحة. والسباحة» والخدمات «az auo SUI‏ والأعمال ASII‏ والعقارات»: 
والأمن الخاص» والاقتراع السياسيء وإلى آخره. وتتعلق هذه البيانات بجميع جوانب الحياة 
اليومية وتشمل الإدارة العامة والاتصالات. واستهلاك السلع ووسائل الإعلامء والسفر 
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والترفيه» والجرممة» وتفاعلات وسائل التواصل الاجتماعية» وإلى اخره» فوسطاء البيانات 
المتخصصين هم متواجدون منذ فترة «4b slo‏ يجمعون البيانات من اشتراكات وسال الإعلام 
(على سبيل «JULI‏ الصحفء واطمجلات)ء وتجار التجزئة عبر طلبات البريدء واستطلاعات «JI‏ 
والدراسات الاستقصائية: ووكالات السفرء واطؤتمرات» والمسابقات» وتسحيلات وضمانات 
المنتجات: وشركات معالجة الدفع والسداد. والسجلات الحكومية» وإلى آخره CIPPIC)‏ 
2006(. وف السنوات الأخيرة. وخاصة منذ ظهور الإنترنت» توسعت هذه الصناعة بشكل 
سريع» مع التنوع في البيانات التي تم التقاطها واختزالهاء والمنتجات والخدمات التي تقدمهاء 
Llig‏ ما gans‏ معا على d>‏ سواء البيانات الضغيرة والكبيرة. 

فبيع البيانات للوسطاء أصبح Jig‏ تدفقا مهما للدخل للعديد من الشركات» فعلى سبيل 
المثالء يبيع تجار التجزئةء في كثير من الأحيان» البيانات المتعلقة بالعمليات Jis‏ تفاصيل 
بطاقة الائتمان» ومشتريات العملاء وبرامج الولاء الخاصة بالمتجرء وإذارة علاقات العملاء 
ومعلومات الاشتراك. كما تبيع المواقع الإلكترونية بيانات النقر (الاختيارات) المتعلقة 
بكيفية تصفح شخص مالموقع على شبكة الإنترنت والوقت الذي يقضيه على مختلف 
الصفحات. وبالمثل تستخلص شركات وسائط الإعلام» مثل محطات الصحف والإذاعة 
والتلفزيون» البيانات الواردة في محتواها (على سبيل JELI‏ الأخبارء والإعلانات). وتستخلص 
شركات وسائط التواصل الاجتماعي البيانات الوصضفية وبيانات المحتوى لمستخدميها. 
وتستخدم هذه البيانات لتحديد المواصفات الأساسية للمستخدمين ومنتجات البيانات 
الخاصة بهم» أو بيع البيانات لوسطاء البيانات. على سبيل «JUL‏ تستخدم شركة فيسبوك 
املفات التعريفية للمليارات من مستخدميهاء وشبكاتهم الاجتماعية. والمحتوى الذي 
يقومون بتحميله (المفضلات. والتعليقات. والصورء والفيديوهات. وما إلى ذلك) لتمكين 
مجموعة من المنتجات الإعلانية مثل الإعلانات الموجهة للجماهر المتمائلة Lookalike)‏ 
(Audiences‏ والجماهير ا مخصصه المدارة (Managed Custom Audiences)‏ وفتات 
الشريك (Partner Categories)‏ وذلك بالشراكه مع وسطاء البيانات الكبيرة والملسوقين 
مثل bl‏ لوجيكس «(Datalogix)‏ وأبسسلون (Epsilon)‏ وأكسيوم (Acxiom)‏ وبلو كاي 
(BlueKai)‏ من أجل دمج بيانات الشراء الخاصة بهم التي لا تخص فيسبوك مع البيانات 
السلوكية التى يوفرها الفيسبوك )2013 (Edwards‏ 
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فبطرق مختلفة: يتخلى الأفراد عن البيانات الشخصية الخاصة بهم» عن قصد أوعن غير 
قصدء وبدرجات متفاوتة: بصفة مشترينء أو مشترکین» أو مسجلينء أو أعضاءء أو dolo‏ 
بطاقات» أو مانحین» أو متسابقین» أو مشاركين ف الاستطلاعات» أو حتى مجرد مستفسرين 
.(CIPPIC 2006: ii)‏ وعلاوة على US‏ وحيث إن إنشاء. وإدارةء وتحليل البيانات هي 
مهمة متخصصة. تستعين العديد من الشركات بجهات خارجية من شركات معالجة البيانات 
وتحليلاتها للوفاء متطلبات البيانات الخاصة بها. وتستطيع هذه الشركات» من خلال 
تقديم هذا النوع من خدمات البيانات لمختلف العملاء بناء مجموعات بيانات واسعة 
النطاق» والتي يمكن الجمع بينها وحزمها لاستخدامها في إنتاج بيانات diria‏ جديدة. والتي 
بدورها توفر المزيد من الأفكار والرؤى مقارنة بتلك التي مكن تحصيلها من مصدر واحد 
his‏ للبيانات» وإضافة إلى هذه البيانات التى يحصل عليها وسطاء البيانات من القطاع 
الخاص» يعمل هؤلاء الوسطاء كذلك على الحصول على مجاميع بيانات القطاع العام سواء 
التي تتعلق بالأفراد أو تلك التي تخض مجموعة منهم كفئة معينة وأماكنهم Jis‏ بيانات 
سجلات اطلكية والتعداد السكاني» كما يقومون باستئجار/ أو شراء القوائم المتعلقة بالأفراد 
من الجمعيات الخيرية وامنظمات غير الحكومية. 

ومن خلال تجميع البيانات من مصادر dde gie‏ ينشيئ وسطء البيانات بنية تحتية من 
السيانات الضخمة وامترابطة. فعلى سبل «JU‏ تشتهر شركة إبسبلون (Epsilon)‏ بامتلاك 
بيانات عن SLG‏ مليون بطاقة ولاء من أعضائها في جميع أنحاء العام إضافة إلى بنك 
معلومات يضم بيانات ذات صلة بمئتين وخمسين مليون مستهلك ف الولايات المتحدة 
وحدها )2013 (Edwards‏ كما تشتهر شركة أكسيوم (Acxiom)‏ بإنشائها Ko‏ للمعلومات 
يتعلق بخمسمائة مليون مستهلك فعّال في جميع أنحاء العام (تقريبا dta‏ وتسعون مليون 
«ac‏ ومئة وستة وعشرون مليون أسرة في الولايات اممتحدة)» مع نحو ألف وخمسمائة 
معلومة عن كل شخص,» وتنفذ خوادمها أكثر من خمسين تريليون عملية في السنة. وتجاوز 
إجمالي تدوير رأس المال للشركة المليار دولار )20122 (Singer‏ كما تدير أيضا قواعد 
بيانات ilai‏ أو تعمل مع سبعة وأربعين شركة من كبرى الشركات المئة الأكبر في العام 
.(Singer 2012a)‏ وتزعم شركة داتا لوجيكس (Datalogix)‏ بتخزينها Ollo‏ متعلقة 
مشتريات ل تتم عن طريق الإنترنت تبلغ قيمتها أكثر من تريليون دولار )2013 (Edwards‏ 
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وتشمل شركات الوساطة والتحليل للبیانات شركات أخرى مثل شركة آلابانس bld‏ سيستمز 
(Alliance Data Systems)‏ وإى بيرو «(eBureau)‏ وتشويس بوينت (ChoicePoint)‏ 
وكورلوجيك «(Corelogic)‏ وإيكيوفاكس (Equifax)‏ وإكسبيريان (Experian)‏ اي دی 
أنالاتكس (ID Analytics)‏ وإنفوجروب «Infogroup)‏ وإننوفيس (Innovis)‏ وإنتليبوس 
(Intelius)‏ وريكورديد 4255.3 (Recorded Future)‏ وسيسنت (Seisint)‏ وترانز يونيون 
.(TransUnion)‏ وتتجه كل شركة من هذه الشركات إلى التخصص ف أنواع مختلفة من 
البيانات ومنتجات البيانات والخدمات» فعلى سبيل «JULI‏ تقيّم شركة إي بيرو العملاء 
المحتملين بالنيابة عن شركات بطاقات الائتمان» وا لمقرضينء وشركات التأمين» والمؤسسات 
التعليميةء كما تقدّم شركة إنتليوس خدمات البحث عن الأشخاص والتحري عن خلفياتهم 
(Singer 2012a)‏ 


وبشكل cele‏ فإن مبتغى وسطاء البيانات وشركات التحليل هو مجموعة واسعة من 
البيانات (الصغيرة والكبيرة): والمتعلقة بأكر شريحة ممكنة من olg GLI‏ تكون هذه 
البيانات مترابطة بشكل كبير ويمكن تمييزها (تحوي تغريف فريد) بحسب طبيعتهاء وكلما 
استطاع وسيط البيانات تصدير ودمج Wal‏ من البيانات» كان عمل منتجاته أكثر نجاحا 
es‏ النحو II‏ واكتسب ميزة تنافسية عن منافسيه الآخرين. ويمكن من خلال جمع 
السيانات معا وهيكلتها بشكل مناسب لوسطاء السبانات اشتقاق Ollo‏ حديدة: وملفات 
تعريفية عن الأفراد والمناطق: والقيام بإجراء النمذجة التنبؤية لتوقع ما قد يفعله الأفراد 
في JB‏ ظروف مختلفة وق أماكن مختلفة. وهذا من شأنه آن مکن من تحديد ا مستهد فين 
وا مخاطر بشكل أكثر فاعلية بين مختلف المستهلكين وأن يُعطي مؤشرا على مدى التصرف 
المحتمل لهؤلاء المستهدفين والدفع بهم لاختيار استجابة معينة (على سبيل «JUL‏ اختيار 
وشراء pais‏ معين)» فشركة أكسيوم تسعى» على سبيل «JUL‏ لربط البيانات غير ا متوافرة 
على الإنترنت Slll (Offline Data)‏ المتوافرة على الإنترنت «(Online Data)‏ وحتى 
السانات المتنقلة (Mobile Data)‏ من أجل تكوين نظرة شاملة متعددة الزوايا عن 
المستهلكين. حيث تستخدم هذه البيانات لإنشاء ملفات تعريفية مفصلة ونماذج تنبؤية 
متماسكة (Singer 2012a)‏ فهذه المعلومات والنماذج مفيدة ias‏ لشركات الشراء لأنها 
تمكنهم من تركيز جهودهم امتعلقة بالتسويق واطبيعات. وتزيد من فرص نجاح عملياتهم» 
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في ذات الوقت الذي تمكنهم من الحد من النفقات من حيث الهدر والخسارة التي قد تنتج 
عن استثمارات محفوفة بالمخاطر. ومن ثم تسعى هذه الشركات لتصبح أكثر فعالية وكفاءة 
في عملياتها باستخدامها لمثل هذه المنتجات. 

ومن امثير للاهتمام» أنه بالرغم من امتلاك وسطاء البيانات وشركات التحليل لكميات 
كبيرة ومتنوعة من البيانات الشخصية التي تستخدم منتجاتها لتصنيف واستهداف الأفراد 
والأسر اجتماعياء فقد كان هناك نقص ملحوظ ف الدفع بالاهتمام النقدي لعمليات هذه 
الشركات. ففي الواقع» هنالك ندرة في التحليل الأكاديمي والإعلامي عن هذه الشركات 
والاثار المترتبة على عملها ومنتجاتهاء ويعود السبب في ذلك جزئيا إلى أن هذه الصناعة 
بعيدة عن الأضواء وسرية نسبياء ولا ترغب في توجيه انتباه الجمهور إليهاء وزعزعة 435 
الجمهور في أصولها وأنشطتهاء والتي قد تؤدي إلى حملات عامة للشفافية: وا لمساءلة: 
والتنظيم. فوسطاء البيانات بشكل عام غير منظمين إلى حد كبير في الوقت الحاضرء كما 
أنهم غير ملزمين قانونياً بتزويد الأفراد بإمكانية الوصول إلى البيانات المحفوظة عنهم ولا 
هم ملزمون بتصحيح الأخطاء المتعلقة بهؤلاء الأفراد (Singer 2012b)‏ وإضافة إلى أن 
بيانات ومنتجات هذه الشركات يمكن أن يكون لها تأثير عميق في الخدمات والفرص المقدمة 
col, 330‏ مثل ما إذا كان سيتم تقديم عرض لفرصة عملء أو قبول تقديم طلب قرضء أو 
إصدار بوليصة تأمينء أو الموافقة على الاستئجار. وتكلفة السلع والخدمات المقدّرة على 
أساس ال مخاطر المتوقعة والقيمة بالنسبة لشركة ما )2002 (Lyon‏ 

إن قلق البعضء بمن فيهم 2013( (Edith Ramirez‏ رئيسة لجنة التجارة الاتحادية 
(Federal Trade Commission)‏ ق الولايات الممتحدةء يتمثل في ممارسة هذه الشركات 
شكلا من أشكال sz‏ 4 البيانات (Data Determinism)‏ التي لا يجري فيها his‏ تصنيف 
الأفراد والحكم عليهم على أساس ما ogled‏ ولكن على التنبؤ ها قد يفعلونه في المستقبل 
باستخدام خوارزميات هي أبعد ما تكون عن الصحة والكمال» بحيث قد تحمل في ثناياها 
تحيزات تتعلق بالعرقء والإثنيةء والجنسء والحياة الجنسية. وحتى «OI‏ فهم صناديق 
سودا Ai‏ إل الرفانة المجدية والإجرادات اللعالجة: eacus‏ ييآنات diio‏ العودة 
على الأغلب» ومن ثم تكون عرضة للخطأ (انظر أيضا للفصل العاشر)» وعلاوة على ذلك 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


السانات الصغرةء والبنى التحتبة للسانات» ووسطاء السانات 


فإن هذه الشركات تستخدم البيانات لغير الأغراض التي تم إنشاؤها لأجلهاء وبالتأكيد 
ليست لأغراض أولتئك الذين تشير البيانات إليهم وتمثل ما قد يرغبون 443( فالذين يتقدمون 
ببياناتهم للحصول على بطاقة ولاء المتجر لا يتوقعون بالضرورة أن يتم بيع بياناتهم 
واستخدامها لأغراض تتجاوز علاقتهم مع المتجرء ولا يتوقعون استخدامها بطرق قد تعرضهم 
للعقاب وامحاسبة بعد ذلك )2013 (Ramirez‏ وبينما يرحب بعض المستهلكين بالعروض 
الشخصية من المتاجر sl‏ الإعلانات الموجهة على المواقع الإلكترونيةء يعدها البعض الآخر 
تطفلا واستغلالية .(Singer 2012a)‏ وعلاوة على US‏ فإن كنز البيانات التي قد يكون 
لها قيمة في المستقبل كإجراء للمضاربة السوقيةء هو انتهاك لقوانين الحدّ من البيانات التي 
تنص على وجوب الإبقاء على السانات محددة القيمة فقط )2013 .(Raley‏ ويعد وسطاء 
البيانات هدفا رئيسيا للمجرمين العازمين على الاحتيال وسرقة الهويات» وذلك بالنظر إلى 
حجم السجلات الشخصية الحساسة Jis‏ الأسماء والعناوين» وأرقام الهوية Ji)‏ الضمان 
الاجتماعي» وجواز السفرء ورخصة (LII‏ وأرقام بطاقات الائتمان المتوافرة لديهم. وف 
الواقع: فقد تابعت لجنة التجارة الاتحادية (Federal Trade Commission- FTC)‏ أكثر 
من أربعين قضية لخروقات أمنية خطيرة للبيانات» أغلبها ضد وسطاء البيانات» لفشلهم في 
توفير ضمانات أمنية كافية على البيانات )2013 (Ramirez‏ 

وف الآونة VI‏ 852 وفي أعقاب الخروقات الأمنية والكشف عن صفقات بيع مشبوهة 
واستخدام لبيانات حساسة )2013 (Dwoskin‏ جنبا إلى جنب مع الكشف عن برنامج 
بريزم التجسسي لوكالة الأمن القومي (NSA PRISM)‏ ووصول الحكومة إلى سجلات تجارية 
(Greenwald and MacAskill 2013)‏ إضافة للأخبار عن فضيحة قرصنة الهاتف العامي 
واستجواب ليفينسون (Leveson)‏ في المملكة المتحدة http://www.levesoninquiry.)‏ 
«(org.uk‏ فقد انصب المزيد من الاهتمام على وسطاء البيانات وممارساتهم التجارية. ففي 
أواخر عام 2012 استدعت لجنة التجارة الاتحادية تسعة من وسطاء البيانات لاكتشاف 
المزيد حول ماهية البيانات والمعلومات المستمدة منها التي يقومون بإنتاجها وجمعها عن 
الناس وكيفيه توظيفهم هذه البيانات وطرق بيعهاء وأصدرت تقريرا يدعو للخصوصية 
عند التصميم (انظر الفصل العاشر)ء وخيارات مبسطة. وقدر أكبر من الشفافية (لجنة 
التجارة الاتحادية 2012 Trade Commission‏ [1606121). وعلاوة على US‏ فقد تم 
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تطبيق الضغط السيامي لاعتماد أنظمة أشد رقابة وأكثر شفافية. أما في أوروباء فيسعى 
قانون الاتحاد الأوروبي الجديد لحماية البيانات لتنظيم كيفية استخدام البيانات» ومنح 
المواطنين الحق في الوصول إلى البيانات والتنازع عليها والحق في تناسيها وحذفها (انظر 
الفصل العاشر). وسيعتمد مدى نجاح مغل هذه الأعمال على إعادة تشكيل أعمال وسطاء 
البيانات والذي سيحدثنا عنه الزمن لاحقاء وق غضون 45« هناك العديد من الأسئلة 
المتعلقة بوسطاء السانات والأسواق واثارها على المواطنين وا مستهلكين التي تحتاج إلى 
استكشاف للإجابة عنها (انظر الفصل السادس). 


الخلاصة: 

على الرغم من الدعوات المنمقة لمؤيدي البيانات الكبيرة وأولويات التمويل للوكالات 
البحثية: فإن البيانات الصغيرة ستستمر بالتقاء تاعتنارها ال saec‏ في فضاء البحث 
العلميء فدراسات البيانات الصغيرة قد تكون محدودة في الحجم» ومحصورة من حيث 
عيناتها وتنوعهاء وثابتة» وغير مرنة بمجرد تنفيذهاء ولكنها خدمت العلوم بشكل جيد حتى 
وقتنا الحاضر لأنها مصممة خصيصا للرد على أسئلة مركزة بإحكام. ويتيح إنتاج البيانات 
الصغيرةء جنبا إلى جنبء مع أدوات التحليل الجيدة, للباحثين التنقيب الدقيق وبشكل فعّال 
في مستويات محكمة من البيانات العالية الجودة من أجل فهم العالم. وف المقابل» وكما 
نوقش في الفصل الثامن» تسعى العديد من دراسات البيانات الكبيرة إلى الإجابة عن الأسئلة 
التي مكن الإجابة عنها من البيانات المنتجة؛ فكما قيل: الذيل الآن هو الذي يهز الكلب. 

ومع ذلك» فمن الواضح أن رؤى وقيمة أكبر بكثير يمكن الحصول عليها من البيانات 
الصغيرة من خلال توسيع نطاقها في البنى التحتية للبيانات والاحتفاظ بها JUS‏ القادمة. 
وقي حين أن البيانات ولفترات طويلة قد جُمعت معاء وجرى تخزينها وأرشفتهاء إلا أن 
تطور التقنيات الرقمية قد غير بشكل جذري قدرتنا على إدارة» وتنظيم» ومعالجةء وتحليلء 
ومشاركة» وإعادة استخدام البيانات» وخاصة تلك البيانات التي ولدت رقمية في الأصلء 
فقد كانت البيانات الصغيرة فيما سبق نادرة ومقيّدة: ولكنها غدت متوافرة بشكل SÍ‏ 
وأكثر انفتاحا (انظر الفصل الثالث). وبتوسيع نطاق هذه البيانات يمكن تحقيق جدوى 
اقتصادية وذلك فيما يتعلق بخدمات البيانات» وآدوات التحليل واموارد التربوية» Ab gg‏ 
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البيانات في استخدامات جديدة» وإنتاج اكتشافات جديدة. OYI Jio eUI iog‏ جهد 
كبير لإنتاج البنى التحتية للبيانات في جميع ال مجالات الأكادممية. وهو الجهد الذي من شأنه 
أن يتيح بشكل أكبر بكثير البيانات للمجتمعات ا معنية وأن zi‏ طبيعة عمل العلوم (انظر 
الفصل الثامن). 

ويتضح (call‏ الذي يمكن من خلاله لهذا التوسع إنتاج قيمة من خلال النمو السريع 
لقطاعى وساطة البيانات والتحليلات ا مصاحبة لها. حيث يمكن لوسطاء البيانات» من خلال 
الجمع بين مخازن كبيرة من البيانات الصغيرة التى تحتفظ بها المؤسسات العامة والشركات 
الخاصة ودمجها جنبا إلى جنب مع مجالات تدفق البيانات الكبرةء إنتاج مختلف أنواع 
الملفات التعريفية التفصيلية للأفراد والمجموعات والتي هكن استخدامها للاستهداف المركز 
للأسواق» وتقسمهاء وفرزهاء مما يوفر معلومات ذات قيمة عالية للعملاء. كما تكشف هذه 
الممارسات عن بعض القضايا وا مخاطر الناجمة عن التوسع في نطاق البيانات» وبالتحديد 
استخدامها لغير الأغراض التي جمعت لأجلهاء وأمنهاء والفرص الجنائية في حال تم سرقة 
البيانات. حيث م يفهم أي من هذه القضايا وا مخاطر بشكل تام حتى OY‏ مع ضعف 
الجانب التنظيمي والإجراءات المضادة. 

فهناك العشرات من:الأسئلة التي تتطلب اهتماما بشأن الدور المستقبلي وطبيعة 
دراسات البيانات الصغيرةء وتوسيع نطاق البيانات الصغيرة إلى أشكال مختلفة من البنى 
التحتية للبيانات والآثار المترتبة عليهاء والعواقب الناتجة عن حفظ البيانات والوساطة 
فيها على أساس الربح. ومع ذلكء فمن الواضح أن التحليل النقدي للتغيرات التي تحدث 
ليست مواكبة للتطورات التقنية والتجاريةء فالواقع أنه حتى الآن كان هناك عدد قليل من 
الانطباعات النقدية ال مبنية على أساس التفكير من خلال الآليات والدلالات ف كيفية إنتاج 
البيانات الصغيرةء وتوسيع نطاقها واستخدامهاء والتنظير لأدواتها - قواعد البيانات والبنى 
التحتية للبيانات - التي يتم استخدامها لتنظيم وتبادل وتحليل البيانات. ونتيجة CUI‏ 
هناك ندرة في المعرفة المتعلقة بالأنظمة الاجتماعية التقنية الناشئة وال معقدة التي يتم 
إنشاؤهاء مع عدد قليل من دراسات الحالة المعمقة. ومن ثمء يتضح أن هناك حاجة للكثير 
من البحث والتأمل لفهم البنى التحتية للبيانات في جميع أشكالها. 
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الفصل الثالث 
السانات المفتوحة (Open Data)‏ والسانات المرتىطة (Linked Data)‏ 


بالنظر إلى التكاليف والنفقات واموارد المطلوبة لإنتاج مجموعات البيانات وقيمتها في 
الكشف عن معلومات عن العام من حولناء فقد تم بشكل عام تقييد الوصول إليها بطريقة 
أو بأخرى» فعلى سبيل JUNI‏ يتاح الوصول للمستخدمين ال مسجلين المعتمدين فقطء أو من 
خلال المطالبة برسوم اشتراك» أو عن طريق حصر الكيفية التي يمكن فيها استخدام البيانات 
بواسطة السياسات والتراخيص. وحتى عندما كانت مجموعات السانات dolu‏ ومفتوحة 
CMS‏ فقد كانت Cala‏ معدات وآدوات متخصصة لفهمها والوصول AJ!‏ مثل أجهزة 
الحاسبء والبرمجيات» واطهارات المتعلقة بطرق الإحصاء ورسم الخرائط وا معرفة السياقية 
للحقل أو الموضوع الذي يجري التطرق إليهء مما يتعذى بكثير قدرات agas‏ الناس. ونتيجة 
لذلك: كانت البيانات واممعلومات المستمدة منها تقليديا مغلقة إلى io‏ كبير بطبيعتها - أي 
مقفل عليها داخل مؤسسة أو محفوظ أرشيفي. وف الواقع» فقد مثل عدم إتاحة الوصول 
إلى مجموعات البيانات التي يمكن أن تساعد في الإجابة.عن أسئلة معينة مصدر إحباط على 
مدى قرون للباحثينء والمحللين. والصحفيينء ومنظمات ال مجتمع GI‏ 

o‏ ومن هذا ا منطلق سعت حركة البيانات المفتوحة لتحويل هذا الوضع جذريًاء ليس 
فقط من خلال فتح البيانات وإتاحتها لإعادة استخدامها على نطاق أوسع فقطء ولكن أيضا 
من خلال توفير أدوات بحثية سهلة الاستخدام والتي لا تتطلب الحاجة إلى مهارات تحليلية 
متخصصة. وبنيت هذه الحركة على ثلاثة مبادئ هي: الانفتاح» والمشاركة: والتعاون 
Cal)‏ الأسض 2009 «(White House‏ فمن خلال الشفافية:» واممشاركة» والعمل [o‏ مكن 
إدراك قيمة البيانات للمجتمع. وتهدف الحركة إلى تحرير القدرة على إنتاج المعلومات 
AS hlo‏ بدلا من حصر إمكانية الاستفادة من قوة البيانات على منتجيها أو أولئك الذين 
مكنهم دفع تمن ]425 الوصول إلى البيانات. وقد تركز الاهتمام» على وجه الخصوصء على 
فتح البيانات التي تم إنتاجها من قبل أجهزة الدولة وغالبا ما يطلق عليها معلومات القطاع 
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JUI الفصل‎ 


العام (Public Sector Information - PSI)‏ أو Sgal‏ الممولة من القطاع العام (انظر 
الفصل (GUI‏ مع الأخذ بالحسبان ob‏ هذه البحوث قد تم تمويلها من قبل الخزينة العامة 
لفائدة عامة الناس» مع تركيز أقل على فتح البيانات التي تم إنشاؤها من قبل القطاع 
الخاص» والتي قد يكون لديها قيمة خاصة أكبر عند منتجيها على وجه الخصوص. 

وقد تطورت حركة البيانات المفتوحة خلال العقدين اماضيينء بالتزامن مع - ولكن مع 
فصل واضح إلى حد كبير عن - حركة الحق ف المعلومات (Right to Information-RTI)‏ 
ا معنية باتخاذ قرارات الشفافية وصنع السياسات من قبل الوكالات والمعروفة أيضا باسم 
حرية اممعلومات (Freedom of Information)‏ وحركتى امصدر ال مفتوح والعلوم ال مفتوحة 
المعنيتين بإعادة تشكيل البرمجيات والنشر إلى أشكال مفتوحة وشفافة فيما يتعلق بالترخيص, 
وحقوق الطبع والنشر» وحقوق املكية الفكرية. فمنذ اواخر سنة 92000 اكتسبت حركة 
البيانات ال مفتوحة مكانة بارزة وزخم ثابت بشكل ملحوظ ابتداء من حملة صحيفة 
الغارديان في المملكة المتحدة تحت مسمى" تخليص باناتنا- Free Our Data" (www.‏ 
(theguardian.com/technology/free-ourdata‏ ودعوة منظمة التعاون الاقتصادى 
والتنمية (Organization for Economic Cooperation and Development - OECD)‏ 
حكومات الدول الأعضاء لفتح بياناتها في «e 2008 ele‏ وإطلاق الحكومة الأمريكية في العام 
9 للموقع الإلكتروني (www.data.gov)‏ وهو موقع على شبكة الإنترنت صمّم لتوفير 
الوصول إلى مجموعات البيانات غير الحساسة والتاريخية التي تحتفظ بها أجهزة الدولة 
على مستوى الولايات ومستوى الحكومة الفيدرالية بالولايات المتحدة الأمريكيةء وتطوير 
البيانات ال مرتبطة والترويج ل الويب (Semantic Web) JYI‏ كعنصر موحد لتكنولوجيا 
الانترنت في المستقبلء والذي يمكن البيانات المفتوحة والبيانات المرتبطة من أن تتصل في 
الغالب بشكل طردي )2009 .(Berners-Lee‏ ومنذ عام 2010 «e‏ حذت حذوها عشرات 
Js 7l‏ واطنظمات الدوليه على سسل «JU‏ دول الاتحاد European Union-) ELSEN]‏ 
(EU‏ وبرنامج الأمم امتحدة الإغمالى United Nations Development Programme-)‏ 
(UNDP‏ مما جعل الالاف من مجموعات اليانات المقيدة TAE‏ متاحة ومفتوحة بطبيعتها 
للاستخدام غير التجاري والتجاري (انظر 2013 .(DataRemixed‏ وقد أسهم في مثل هذا 
التحوّل ف الموقف مجموعات الضغط الدولية والوطنية المؤثرة مثل مؤسسة ال معرفة المفتوحة 
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البيانات المفتوحة والبيانات المرتبطة 


(Sunlight Foundation) ومؤسسة ضوء الشمس‎ (Open Knowledge Foundation) 
من المجموعات والشركات العاملة في مجال الاقتصاد ا معرف. بالإضافة إلى‎ Ja so ورافقه‎ 
موظفي الخدمة امدنية المقتنعين بالحجج المستخدمة: وعشرات الجماعات ال محلية التي‎ JLS 
تسعى للاستفادة من السانات امدنية.‎ 

وق حين يتم عرض حجج حركة البيانات المفتوحة بطريقة بديهيه»ء باستخدام مفردات 
الاستعارة LEII‏ مثل الشفافية: واطساءلة؛ AS JL LZ ls‏ والابتكار, والنمو الاقتصاديء فإن 
الانفتاح السريع للبيانات الحكومية والعلمية م يلق Lj‏ ا فالواقع, أن العديد 
من الاثار الاجتماعية والسياسية والاقتصادية لفتح البيانات يجري حاليا الكشف عنها 
ومناقشتها وانتقادها. وعلاوة على US‏ وللمفارقة إلى حد cdo‏ تعزز نطاق ومدة حقوق 
ا ملكية الفكرية على مدى نصف القرن الماضيء بمعنى أن نمو خركة البيانات المفتوحة تم 
بالتوازي مع زيادة في حقوق الملكية الفكرية )2006 (Pollock‏ فامقاومة التي واجهتها 
فكرة توفير حرية الوصول إلى البيانات العلمية نوقشت في الفصل السابق» وسيتم في القسم 
الأخير من هذا الفصل مناقشة الانتقادات الموجهة لدعوى البيانات المفتوحة. قبدايةء ومع 
LS‏ يحدد هذا الفصل خصائص السانات المفتوحة والسانات المرتىطة» ومختلف الطرق 
التي duai) WIN‏ السانات ال مفتوحة. والاقتصاديات ا مرتبطة بتقديم بيانات dies «Ao giña‏ 
الرغم من أن فتح البيانات الحكومية ما يزال Lye‏ فليس هنالك شك à‏ أن $29 lS‏ 
يحدث بشأن الكيفية التي تتم من خلالها عرض ومشاركة البيانات بشكل عاة. 


السانات المفتوحة (Open Data)‏ : 
عند أحد المستوبات» Aso‏ تعريف مصطلح البيانات المفتوحة بسيط NE‏ فقد حدده 
بولوك )2006( على سبيل JUL‏ كالتالي: «تكون البيانات مفتوحة إذا كان لأي شخص الحرية 
في استخدامهاء وإعادة استخدامهاء وإعادة نشرها - فقط شرط موافقتها لمتطلب إسنادها 
و/ أو مشاركتها على حد سواء». ولكن هذا التعريف يلمح إلى الطبيعة المتنوعة لما مكن 
أن يكون عليه المقصود من لفظة «الفتح» وكيف أنها يمكن أن تعني أشياء مختلفة بالنسبة 
لمختلف الوكالات في سياق حقوق الملكية الفكريةء فقد يشير الانفتاح إلى الاستخدام 
أو إعادة الاستخدام» أو إعادة الصياغة:. أو إعادة التوزيع: أو إعادة النشر والتوزيع؛ أو 
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JUI الفصل‎ 


إعادة البيعء وقد يكون لكل منها شروط وأحكام تختص بهاء فعلى سبيل المثال قد يكون 
للمستخدم القدرة على استخدام مجموعة البيانات بحرية موجب ترخيصء ولكن ذلك لا 
يعني إمكانية إعادة التعامل مع هذه البيانات بهدف eo JI‏ التجاري أو إعادة egal‏ أو 
أي استخدام قد يتطلب الإسناد. وبعبارة 5,21« قد يكون الوصول إلى مجموعة البيانات 
مفتوحاء ولكن ليس بالضرورة أن يكون كل ما يمكن فعله مع البيانات الممكن الوصول إليها 
مفتوح أيضا. وف حالات asi‏ قد تحتفظ ال منظمات ببياناتها وتتحكم بإتاحة الوصول 
إليها بنفسهاء ولكنها تتيح بحرية البيانات الوصفية المتعلقة بها فقطء أو قد تسمح ال منظمة 
لبعض ال مستخدمين بالوصول إلى البيانات» ولكنها لا تمكنهم من إعادة نشرها إلا إذا كان ذلك 
سيحقق قيمة مضافة لها وبدون الوصول إلى البيانات الأولية الأساسية. 

ومع US‏ سعت عدد من اطنظمات إلى تحديد الخصائص امثالية للبيانات المفتوحة. 
على سبيل JULI‏ يؤكد تعريف الانفتاح ob‏ العمل هو مفتوخ إذا استوفت alo‏ في النشر 
الشروط ال منصوص عليها في الجدول رقم (Y- Y)‏ والتي تفرض بعض القيود على الوصولء 
والاستخدام» وإعادة الصياغة: وإعادة التوزيع والنشرء وتشجع EUIS‏ بشكل نشط على 
الاستخدام الربحي للبيانات المفتوحة دون أي تعويض مالي طمنشئ البيانات الأصلي. وبالمثل: 
حددت منظمة الحوكمة ال مفتوحة (OpenGovData)‏ تسعة مبادئ للسانات ال مفتوحة 
تتعدى مجرد نمط التوزيع إلى النظر أيضا في طبيعة البيانات نفسها (انظر الجدول رقم 
3-2). وبالإضافة إلى هاتين المجموعتين من الشروط / المبادئ: اقترحت وكالات أخرى مثل 
منظمة التعاون الاقتصادى والتنمية )2008( (OECD)‏ والحكومة الأسترالىة Fitzgerald)‏ 
0) حاجة البيانات ا مفتوحة إلى أن تكون مصحوبة بقوائم الأصول وآليات اكتشاف 
البيانات» من أجل إصدار المؤشرات المتعلقة بجودة البيانات وموثوقيتهاء واستخدام النماذج 
وامعايير التي تتيح قابليه التشغيل البيني للبيانات ال مفتوحة. وتوفير بنى تحتية سهلة 
الاستخدام للبيانات لتسهيل النشر المنتظم وإيجاد مجموعات بيانات جديدة: بالإضافة 
إلى عدد من الأدوات الأساسية والتخصصية التي من شأنها أن تحسن الاستخدام والتحليل 
للبيانات. ويعد ضمان التشغيل البيني مهما بشكل خاص لأنه يسمح بربط مجموعات 
البيانات المختلفة, مما يُسهم ف بناء مجموعات بيانات جديدة أكثر تعقيدا واكتشاف رؤى 
جديدة dò shl duwga)‏ الطفتوحة 2012 .(Open Knowledge Foundation‏ كما لا توحد 
قيود فيما يتعلق بمجالات التركيز للبيانات المفتوحة - حيث يمكن أن تتعلق بأي مجال 
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البيانات المفتوحة والبيانات المرتبطة 


من ال مجالات الاجتماعية» والاقتصادية: والتجارية: والثقافية (وسائل الإعلام وال مكتبات 
والتراث)» والبيئية» أو الظواهر العلمية - ولكن» بشكل «ele‏ ينصب التركيز حتى الآن على 
فتح البيانات التي Las‏ بالسياسات العامة عالية ا مستوى ولها قيمة تجارية عند إعادة 
استخدام مثل السانات ال متعلقة بالاقتصاد. والنقلء والسانات الجغرافية. 
جدول رقم (Y-Y)‏ 
الخصائص JELI‏ للبيانات ال مفتوحة المتعلقة بتعريف الانفتاح 


إتاحة الوصول Access‏ إينبغي أن يكون العمل متاحا مجموعه ككل وبلا تكلفة إعادة 


إنتاج تتجاوز المعقول كما ينبغي أن تتوفر بشكل مناسب قابل 
للتعديل 








إعادة التوزيع 


Redistribution 


ينبغي أن لا 25 à Laz JI à‏ أي طرف عن بيج العمل أو 

توزيعه سواء فيما يتعلق بالعمل نفسه أو كان ذلك العمل 

وينبغي أن لا يتطلب الترخيص إتاوة 9l‏ رسوما أخرى لهذا 

البيع أو التوزيع. 

إعادة الاستخدام Reuse‏ ينبغي ol‏ يسمح الترخيص بالتعديل على العمل وإجراء عمليات 
الاشتقاق dia‏ ويسمح كذلك بتوزيع الأعمال المشتقة ET‏ لآحكام 
العمل الأصلى. 






ous‏ القيود التقنيه Absence‏ يبشسعى 2425( العمل T r-‏ الصورة التى لا دوحل معها عقبات 
of technological restrictions‏ | 435 تحول دون استخدامه أو إعادة توزيعه. 


Attribution LY]‏ قد eb‏ الترخيص الإسناد إلى اللساهمين وا مبدعين للعمل 
الأصلي كشرط لإعادة التوزيع وإعادة الاستخدام» وإذا تم فرض 
هذا الشرط فينبغي ألا تتطلب عملية الإسناد إجراءات مرهقة 
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من اللممكن أن biis‏ الترخيص حمل الإصدارات اللعدلة للسانات 
أسماء تختلف عن العمل الأصلي كشرط لإعادة توزيعها. 

"T‏ ينبعى عدم مسر الترخيص AL‏ أي شخص أو مجمو ÅS‏ من 
الأشخاص وضمان إتاحة الوصول للجميع. 


ينبغي عدم تقييد أي شخص من الاستفادة من العمل في أي مجال 


معين. على سبيل امثالء لا ينبغي تقييد العمل من استخدامه في 
الأعمال التجارية. 


ينبغي تطبيق الحقوق المتعلقة بالعمل على جميع الذين يتم 
إعادة توزيعه عليهم دون الحاجة لتنفيذ ترخيص إضافي من قبل 
تلك الأطراف. 





ينبغي أن لا يضع الترخيص قي ودا على الأعمال الأخرى التي يتم 
توزيعها جنبا إلى جنب مع العمل المرخص. على سبيل المثال 
ينبغي أن لا يضر الترخيص على أن تكون كل الأعمال المستمدة 
dio‏ مفتوحة FS‏ 
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قغاة المكنبة على النبليجرام 





الفصل الثالث 


الصحة والنزاهة Integrity‏ 


عدم التمسز صل الأشخاص أو 
ا ملجموعات 
No discrimination against‏ 


persons or groups 


عدم التمييز ضد مجالات معينة 
في العمل No discrimination‏ 


against fields of endeavor 


Distribution الترخيص‎ 2:55 
of licence 


عدم تعيين الترخيص على حزمة 
أعمال Licence must not be‏ 


specific to a package 





عدم تقييد الترخيص توزيع 
الأعمال الأخرى Licence must‏ 


not restrict the distribution 


of other works 





المصدر: مقتىس من .http://opendefinition.org/od‏ 
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البيانات المفتوحة والبيانات المرتبطة 


جدول رقم (Y-Y)‏ 
مبادئ منظمة الحوكمة المفتوحة للسانات المفتوحة 


يجب أن تكون البيانات كاملة تكون كافة البيانات متاحة. مع مراعاة أحكام وشروط 


الخصوصية. والأمن أو 35,8 الصلاحيات. 
Data must be complete‏ لخصوصيهة» والامن او قيو يات 





يجب أن تكون البيانات أساسية (أولية) أ تنشر البيانات كما تمّ جمعها من المصدرء مع أفضل 
مستوى ممكن من التفاصيل» وليست بأشكال مجملة أو 


معدلة. 









Data must be primary 





يجب أن تكون البيانات فى الوقت | إتاحة البيانات فى أسرع وقت ممكن غند الحاجة لها 
cli‏ للحفاظ على قيمة البيانات. 





Data must be timely 
ممكن من المستخدمين ولأوسع‎ 24e يجب أن تكون البيانات في المتناول | إتاحة البيانات لأكبر‎ 


مجموعة من الأغراض. 









Data must be accessible 





يجب أن تكون البيانات قابلة للمعالجة | تنظم البيانات بشكل مناسب للسماح بالمعالجة الآلية لها 
الآلية 
Data must be machine-‏ 
processable‏ 
يجب عدم تمييز عملية الوصول تتوفر البيانات لأي «Al‏ مع عدم اشتراط التسجيل. 
Access must be non-‏ 


discriminatory 


يجب أن تكون صيغ البيانات غير | تتوفر البيانات في صيغة لا يكون فيها سيطرة حصرية 
مخصصة الملكة عليها OLS SY‏ 


Data formats must be non- 


proprietary 
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JUI الفصل‎ 


يجب أن يكون ترخيص البيانات مجانياً | لا تخضع البيانات لأية أحكام في حقوق التأليف والنشر 

وبراءات الاختراع والعلامات التجارية. وقد يُسمح ببعض 

قيود الخصوصية والأمن والصلاحيات المناسبة بحسب ما 
تفرضه التشريعات الأخرى. 


Data must be licence-free 


يجب أن يكون الامتثال قابلا للمراجعة | يجب أن يتم تخبين شخص كضابظ اتصال 3,0 على الناس 
وإعادة النظر الذين يحاولون استخدام البيانات أو تقديم شكاوى حول 
انتهاكات ال مبادئ الرئيسية. ويجب أن يكون هناك iua‏ 
أخرى ذات اختصاص لتحديد ما إذا تم تطبيق المبادئ 
کل xol:‏ 


Compliance must be reviewable 





امصدر: مقتىس من http://www.opengovdata.org‏ 

وإلى جد كبير. تعد dia‏ الخصائص AJEL‏ البيانات المفتوحة مُنتجاء وليست,خدمة. وف 
lähi‏ فقد جادل )2013( Gurstein‏ حول الحاجة إلى إعادة التفكر بالبيانات المفتوحة 
كعملية -(Service process) dass‏ بوصفها تفاعلا وتنطوي على علاقة بين مزودي البيانات 
وا مستخدم النهائي. فبالنسبة له» لا يكفي أن تكون البيانات ببساطة متاحة من قبل المنظمات 
لإعادة استخدامهاء بل ينبغي أن يكون فتح البيانات موجّها أكثر باعتباره daas‏ مع الأخذ بعين 
الاعتبار حاجات وتوقعات المستخدمين النهائيين dgio‏ فهذه الإعادة لصياغة المفاهيم تقترح 
على أولئك الذين ينتجون البيانات ا مفتوحة اتباع طرقا مختلفة لإدارة البيانات وا لملستخدمين 
النهائبين:ء كالآثار المترتبة على قضايا إعادة تحديد المصدر الخاص بالبيانات. فبالنسبة 4 
يتطلب هذا النوع من النهج مشاركة ا مستخدمين النهائيين في التخطيطء والتطويرء وإدارة 
ا لمشاريع الجارية للبيانات المفتوحة: وكذلك استخدام مقاييس لتقييم مدى نجاح مثل هذه 
ا مشاريع في تعزيز الصالح elol‏ وهذا يتطلب برامج بناء القدرات الرامية إلى رفع مهارات 
aS‏ ليكونوا قادرين على إدارة ومعالجة وتحليل البيانات بشكل مناسب وفعال. 
ورغم أنه من السهل أن نتفق على أنه ينبغي تسليم البيانات المفتوحة كخدمة» إلا أن 
البيانات المفتوحة بطبيعتها لا تنتج دخلا أو تنتج القليل مقابل تمويل هذه الترتيبات الخدمية 
فضلا عن التكاليف المتعلقة بفتح OLLI‏ فالواقع أن ذلك قد يكون من الطموح إلا إذا تم 
تطوير نماذج تمويل فعالة LS)‏ نوقش أكثر بالكامل أدناه). 
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البيانات المفتوحة والبيانات المرتبطة 


السيانات المرتبطة (Linked Data)‏ : 
Jia‏ فكرة البيانات المرتبطة بتحويل شبكة الانترنت من شبكة الوثائق إلى شبكة البيانات 
من خلال إنشاء الشركة الدلالية )2010 (Semantic web) (Berners-Lee 2009; P. Miller,‏ 
أو ما اصطلح عليه 2010( (Goddard and Byrne‏ مصطلح «امقروءة Ui‏ على شبكة الإنترنت» 
.(Machine-Readable Web)‏ وتدرك هذه النظرة بأن 485 المعلومات التي يتم تبادلها 
على الإنترنت تحتوي على تنوع غني للبيانات - أسماء» وعناوين» وتفاصيل «eil‏ والحقائق 
والأرقام إلى آخره. ومع ذلك لا يتم بالضرورة تحديد هذه البيانات رسميا على هذا gall‏ 
كما أنها ليست منتظمة رسميا في طريقة يمكن معها جمعها واستخدامها بسهولة فالواقع» أن 
معظم وثائق شبكة الإنترنت غير منظمة إلى o‏ كبير في طبيعتها. ومن خلال ترميز الوثائق 
وهيكلتها باستخدام معرّفات فريدة واستخدام لغة التوصيف «Markup Language)‏ مکن 
جعل البيانات التي تحتويها هذه الوثائق dye‏ وتمكين الآخرين تلقائيا من دمجهاء ومعالجتها. 

وفهمهاء وربطها مع البيانات الأخرى ذات الصلة )2010 (P. Miller,‏ 

ومن أجل تمكين شبكة الإنترنت الدلالية من أن تعمل كبيانات مرتبطة؛ بین Berners-‏ 
Lee (2009)‏ حاجة الوثائق المنشورة على شبكة الإنترنت للمواءمة مع أربعة توقعات 
سلوكية. «el‏ يجب تعويف الكاثنات واطوارد ضهن كل وثيقة باسبتخدام لغة التوضيف 
اموسعة (XML- Extensible Markup Language)‏ وتسميتها بشكل واضح لا لبس فيه 
باستخدام معرفات الموارد الموحدة (Uniform Resource Identifiers -URIs)‏ اشنا 
ينبغي استخدام الهيكل الضمني لشبكة الإنترنت Ja; J‏ الوثائق والمعلومات (على سبيل 
«JULI‏ استخدام معيار نقل النصوص التشعبية - أتش ت (HTTP) à à‏ ومعرفات الموارد 
الموحدة (URIS)‏ بحيث بمكن التنقيب في الأسماء والبحث فيها). ثالث تسهيل اكتشاف 
المعلومات حول كائن مسمى أو مورد (على سبيل ال «JUL‏ عندما يقوم شخص بالبحث عن 
معرّف لكائن do‏ تقدّم له معلومات مفيدة باستخدام معايير إطار عمل وصف الموارد 
.(Resource Description Framework -RDF)‏ فإطار عمل وصف الموارد هو iog‏ 
تفصّل وتصف طبيعة معرّفات الموارد ضمن نطاق ما وينبغي أن يُحال كل معرّف إلى 
هذه الوثيقه لتحصيل معلوماته )2010 .(Goddard and Byrne‏ ويضمن استخدام 
هذه المعايير إطاراً مشتركا لجمع البيانات عبر الإنترنت» بدلا من اعتماد مجموعة كبيرة من 
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الفصل الثالث 


الأسالي المتعارضة )2012 dsl; (Dietrich‏ توفير وصلات للربط بين SLI‏ واموارد 
ذات الصلة: ]15 كانت معروفة» بحيث مكن للمستخدمين اكتشاف المزيد من الأشياء. 

وتمكن هذه التوقعات السلوكية من جعل الوثائق مقروءة آليا ويمكن معالجتها بحيث 
يكون التعرف على طبيعة الكائنات فيها ممكنا (على سبيل JELI‏ الولايات ael‏ هي بلد. 
وبارآك blial‏ هو شخض)ء Ihla‏ الغموض عن المفاهيم dde)‏ سبيل JEU‏ ارس هو قطعة 
شوكولاتة: والمريخ (مارس) هو كوكب؛ أو أن باراك أوباما هو مؤلف وثيقة مقابل أن باراك 
أوباما هو موضوع (iiig‏ وإنشاء روابط وعلاقات داخل البيانات (على سبيل JEBI‏ باراك 
أوباما هو رئيس الولايات المتحدة) )2010 .(Goddard and Byrne‏ وبهذه الطريقة: 
يصبح من الممكن لوثائق شبكة الإنترنت أن تكون قابلة للقراءة UI‏ بحيث لا يقتصر عمل 
برنامج القراءة على ao‏ المحتوى ولكن ax‏ أن يستمد أيضا Ais iuo Olly‏ جديدة من 
خلال الاستدلال من ال محتوى )2010 (Goddard and Byrne‏ 

ET‏ تنشر الوثائق بهذه الطريقة. مكن استخلاص المعلومات على شبكة الإنترنت 
وإعادة تقدهها كبيانات وربظها بطرق Y‏ حصر لها اعتمادا على الغرض. ولكنء وبحسب 
ما دون )2010( P. Miller‏ فإن «السانات امرتبطة مكن أن تكون بيانات Áo gia‏ ويمكن 
ربط السانات «Ao zal‏ ولكن من ال ممكن SBL La]‏ ال مرتطة أن تحمل ضا أو 
غيرها من القيود التى تحول دون اعتبارها مفتوحة»»: أو إتاحة السانات المفتوحة بطرق قد 
لا تجعل من السهل ربط بعضها ببعض. وبشكل «ele‏ فإن أي وثائق مرتبطة ليست متوافرة 
على شبكة الإنترنت أو تقع ضمن نطاق نظام اشتراك مدفوع هي أيضا بيانات مفتوحة 
بطبيعتها. فبحسب ما یری )2009( Berners-Lee‏ ينبغي أن تكون السانات المفتوحة 
والبيانات ال مرتبطة متكافئة بشكل «JU‏ وإضافة لذلك فقد حدد خمسة مستويات EL‏ 
هذه OLJI‏ كل منها أكثر فائدة وقيمة تدريجيا (انظر الجدول رقم 3-3). وكان تطلعه 
الى ما أسماة بيانات الخمسة نجوه (المستوى الخامس) - شبكة دلالية عاملة بالكامل. 
ولكن تجدر الإشارة إلى أنه بالنسبة إلى العديد من المنظمات» فإن مجرد الحصول على 


مستويات أعلى من امستوى الأول يعد إنجازا وكون امستوى الخامس Jas‏ اطنال عنها دون 
عمالة ماهرةء وموارد إضافية: وأدوات جديدة. 
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البيانات المفتوحة والبيانات المرتبطة 


(Y-Y) الحدول‎ 


المستوبات الخمسة للبيانات المفتوحة والسانات المرتبطة 


LUI‏ متوافرة. 















مقروءة آلياً ولكن بصيغة 
حصرية de)‏ سبيل JLI‏ 
ملف اكسل): 


يمكن تحليل البيانات تعتمد على برامج حصرية 
باستخدام البرمجيات الحصرية | للوصول إليها واستخدامها. 
/ الاحتكارية؛ كما مكن 
تصديرها إلى صيغ أخرى. 
مقروءة آليا باستخدام.صيغ | هكن تحليل البيانات 
باستخدام أية حزمة 





هل السانات على AJI‏ 
ليست البيانات على 
Ail‏ وليست مرتبطة 
بطبيعتهاء ومن ثم هي 


معزولة. 





عامه غير حصرية 
(على سبيل «JUL‏ صيغة سي 
إس $- (CSV‏ 


برمجية. 





مقروءة Ul‏ باستخدام ضيغ | هكن الوصول إلى البيانات | كن أن تزيد زمن تحضير 
äle‏ غير حصرية واستخدام | من أي مكان على شبكة | البيانات وإدارة البيانات 
المعرفات ووصف اموارد | الإنترنت» ومن السهل ربطها وتبادلها. 
(URIs and RDF)‏ | جنبا إلى جنب مع غيرها من 
البيانات» وإمكانية وصلها 
بالأدوات والمكتبات القائمة. 


مقروءة آليا باستخدام Reo‏ | كما ف المستوى الرابع» | تحتاج إذارة فعالة للبيانات 
عامة غير حصرية واستخدام | ولكن تصبح البيانات أكثر للحفاظ على الروابط 
امعرفات ووصف 3ylall!‏ اكتشافا وتمنح ال مستخدمين الداخلة والخارحة. 
ومرتبطة بالبيانات والبيانات | وصولا كاملا إلى مخطط 
الوصفية الأخرى (أنطولوجيا) البيانات 





المصدر: معدلة عن http://sstardata.inio.‏ بواسطة .Michael Hausenblas‏ 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 10 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الثالث 


الدعوّى نحو السانات المفتوحة: 
في حين كان لدى بعض البلدان» مثل الولايات المتحدة. تقليد عريق في de>‏ بعض 
بيانات القطاع العام متاحة بحرية. وخاصة البيانات ذات الفائدة العالية مثل Ollo‏ 
التعداد. ورسم الخرائطء والطقس.ء فإن إتاحة الوصولء في بعض البلدان الأخرى» يتم بشكل 
عام من خلال نموذج تغطية التكاليف الذي يتيح البيانات بمقابل مالي وموجب اتفاقية 
ترخيص معتمدة. ففي المملكة ال متحدة: تخضع الوثائق الحكومية لحقوق التأليف والنشر 
الملكية (Crown Copyright)‏ وتحكم البيانات ذات الفائدة العالية بواسطة الصناديق 
التجارية (على سبيل (JULI‏ بيانات الخرائط ضمن هيئة المسح الجغرافيةء وبيانات أحوال 
الطقس في مكتب الأرصاد الجوية) التي تعمل بصفة كيانات احتكارية» وتتحكم في الوصول 
إلى مجموعات انات رئيسية )2006 .(Arthur and Cross 2006; Pollock‏ وعلى مدى 
العقدين الماضيين: تم تجميع مجموعة من الحجج لبناء دعوّى إعادة صياغة دور هذه 
الصناديق وفتح بيانات القطاع العام للجمهور. وبصفة «dle‏ هكن تقسيم هذه الحجج 
والاستحقاقات في خمسة أشكالء. والتي ينظر إليها على أنها ذات فائدة لكل من Jal‏ 
البيانات والمستخدم UJ!‏ 
أولا: .حيث أن الكثير من :البيانات:في إطار.الهيئات:العامة وال منظمات,غير الحكومية تتعلق 
بالعمليات التشغيلية لتلك الهيئات» فهي توفر وسيلة يمكن من خلالها قياس مدى 
نجاح مختلف البرامج والأنشطة الخاصة بها. ولذا فإن فتح هذه البيانات للتدقيق 
والرقابة العامة سيجعل أعمال المنظمة وصنع القرار فيها تتمتع بالشفافية ويمكن 
استخدامه لتعزيز المساءلة وتقييم القيمة الناتجة مقابل JU.‏ ال مستثمر Janssen)‏ 
Gordon 2013‏ :2012). وقد تزايدت أهمية هذه الشفافية وال مساءلة في الخطاب 
العام في عصر سياسات التقشف ومحدودية الموارد» وق سياق امناقشات الجارية 
حول «ob xl‏ والهدرء والعجز الظاهر ف الخدمات العامة. 


LÈ‏ يسمح dol]‏ الوصول للمستخدمين النهائيين لبيانات ال منظمة. على زعم البعض» 
برفع مستوى الوعي حيال القضايا SLI‏ مما يسهل الاختيار وصنع القرار فيما 
يتعلق بالخدمات العامة» ويشجع على المشاركة الفاعلة والواعية في المجال العام 
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البيانات المفتوحة والبيانات المرتبطة 


.(Janssen 2012: Yiu 2012)‏ وعلاوة على ذلك» Gl‏ إتاحة الوصول للمستخدمين 
النهائيين لبيانات المنظمة يعزز المواطنة الفاعلة وا مشاركة السياسية في تشكيل 
كيفية slol‏ وتنظيم الحكم المحلي )2011 .(Huijboom and Van der Broek‏ 
وهذه» بدورهاء تشجع الابتكار الاجتماعي. وتعمل على تعزيز العلاقات بين أفراد 
المجتمع» ورفع مستوى النقاش العام )2012 (Yiu‏ ونتيجة CU‏ تمكن البيانات 
امفتوحة من slo‏ الدموقراطية éll‏ على المشاركة. 


: يشجّع فتح البيانات حول المنظمة وأدائها على استخدامها هذه البيانات للاستفادة 


في تحسين الكفاءة التشغيلية والإنتاجية من خلال ال مراقبة واتخاذ القرارات بالأدلة 
والبّنات المشتة. وعلاوة على ذلك» تحصل وحدات الأعمال داخل المؤسسة على 
حق dl Jesi‏ البيانات وإمكانية استخدامها عبر المنظمة بكاملهاء مما يؤدي إلى 
رؤى ومعارف جديدة ومزيد من التفكر المشترك والكفاءة );2012 Northcutt‏ 
.(Verwayen et al. 2011‏ وإضافة لذلك» فإنه مكنهم اكتساب ملاحظات وردود 
قيّمة وتلقي النصح والمشورة من الوكالات الخارجية التي تقوم باستخدامهاء وتحليلها. 
وتفسيرهاء مما يرفع من مستوى Gogl‏ والنزاهة» والفائدة من البيانات. وتؤدي 
هذه التحليلات الداخلية والخارجية إلى تعزيز الحوكمة التنظيمية وإدارة المجتمع 
على نطاق أوسع» على سبيل JULI‏ التصدي للغش والتزوير والجرائم الأخرى من 
خلال إنشاء خدمات أكثر فعالية )2011 .(Huijboom and Van der Broek‏ كما 
أنها تمكن من الرصد والتقييم المستمرين SY‏ السياسات والبرامج الجديدة (مؤسسة 
اطمعرفة اطفتوحة 2012 (Open Knowledge Foundation‏ 


رابعا: مکن توفير البيانات ال مفتوحة من إثراء العلامة sl‏ 65( فإتاحة البيانات بحرية يرفع 


من شأن المنظمة: ويدلل على ريادتهاء وروح المبادرة فيهاء ويخدم مهمتها العامة 
ويزيد مستوى الاتصال والتفاعل مع العملاءء والمستخدمين النهائيين ويقود التوجه 
إلى الخدمات اممؤسسية )2011 (Verwayen et al.‏ وق المقابلء يبني هذا الثقه 
والسمعةء ويعمل على تكوين انطباع عن المعايير الفاضلة للمؤسسة. 
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خامسا: بينما تمتلك بعض مجموعات البيانات المنشئة والقائمة في العلن قيمة اقتصادية هامشية 
على سبيل JUL‏ تلك المتعلقة بالتراث الثقافي: فإن الكثير من مجموعات البيانات الأخرى 
لديها das‏ تجارية كبيرة. ويمكن استخدام البيانات التي تم إنشاؤها علنا لإضافة قيمة 
إلى البيانات التجارية القائمة. وإنشاء تطبيقات وخدمات جديدة ومن ثم أسواقا CERC‏ 
وتحسنن المعرفة واتخاذ القرارات للأعمال )2012 Yiu‏ :2012 713115562). ولذا فليس من 
المستغرب عندئذ حرص المصالح الصناعية على الدعوة لفتح البيانات ال منتجة Lile‏ لإعادة 
استخدامها في القطاع التجاريء وخاصة البيانات التي Ulo‏ غرفت باحتوائها وإمكانية 
إنشائها لقيمة كتلك التي تدار من قبل صناديق تداول القطاع العام (على سبيل JE‏ 
بيانات الخرائط). فهناك من يزعم بأن تقييد الوصول إلى البيانات العامة: والتي تم إنشاؤها 
من أجل المصلحة العامة يخنق الابتكار ويعمل على فقدان وزن مميت للاقتصاد؛ أي أن 
حضر استخدامها فقط طن لهم القدرة على تحمّل تكلفتهاء هو تسعير لإخراج الآخرين من 
السوق )2012 .(Pollock 2006: Yiu‏ ولذا فإن الاستثمار العام في إنتاج البيانات لم يستغل 
بالشكل المناسب كما تم فقدان العديد من الفرص التي من شأنها أن تضفي قيمة على 
نشاطات القطاع الخاص )2012 .(Yiu‏ وإضافة إلى US‏ فقد تأثير الارتفاع على الاقتصاد 
الشامل نتيجة فقدان القيمة الناتجة عن فتح البيانات العامة )2012 (Northcutt‏ 


وتتفاوت كيفية احتساب أوزان هذه الحجج الخمس عندما يتم تقديمها عر السلطات 
القضائية والسياقات امختلفة؛ ؛ ومع EUS‏ فهى تشكل à daina‏ نظاما ذا منطق قوی حقق 
lolo:‏ ملحوظا في إقناع ا منظمات لفتح البيانات الخاصة بهاء لأسباب ليس أقلها أنها تتو 
مع العمليات الجديدة للخصخصه (Newliberalism)‏ التي تعزز تسويق الخدمات e‏ 
.(Bates 2012)‏ وق الواقع» فإن المحرك للحجج المتعلقة بفتح البيانات في الغالب هي 
امصالح السياسية والتجارية التى تهدف إلى دفع ال مؤسسات العامة والمنظمات غير الحكومية 
للحصول على وصول إلى سلعة did‏ بدلا من السعي لتحدي مفهوم الملكية الفكرية في حد 
ذاتها )2011 .(Verwayen et al.‏ 

في اطمقابل» ومما لا يثير الدهشة ف هذا السياقء أن الحجج والدعاوى لقطاع الأعمال 
لإتاحة بياناتها بحرية لإعادة استخدامها على نطاق أوسع لم يجر تطويرها والترويج لها 
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على نحو كاف. ومع «AUS‏ فإن العديد من الحجج نفسها لفتح بيانات القطاع العام تصلح 
لبيانات الأعمال أيضاء أو على الأقل عناصر مختارة من هذه البيانات. ففتح البيانات من 
شأنه أن يمكن الشركات من الاستفادة من التحليل والرؤى التي تنتج بواسطة الغير من 
المستخدمين النهائيين» والجمع بين البيانات ومجاميع البيانات الأخرى التي تعمل على 
إثرانهم بطرق مثمرة. وتعزيز التعاون مع الشركاء والموردين مما guas‏ فعالية في مجال 
الخدمات اللوجستية وامنتجات الجديدةء وبناء le‏ مع العملاء تساعد على توسيع قاعدة 
العملاء وتعزيز الملف التعريفي للشركة وسمعتها )2012 (Deloitte‏ وعلاوة على ذلك 
فإنها قد تساعد على تطوير الشراكات بين القطاعين العام والخاصء وف هذا السياق تم 
اعتماد نهج الابتكار المفتوح» والذي حقق نجاحا فيما يتعلق بالبرمجيات المفتوحة؛ والعمل 
على laus‏ أن تقاسم الموارد سينتج المزيد من القيمة التجارية دون الحرض على اكتنازها 
بغيرة والتحرز عليها. ففي الحالات التي تلقت الشركات الخاصة أموالا عامة للمساعدة 
في البحث والتظويرء يمكن إقامة دَعْوَى على أن أي بيانات تنتج عن Jis‏ هذه المحاولات 
ينبغي أن تكون مفتوحة إما بشكل كامل وإما بشكل انتقائي كوسيلة لإنتاج سلعة عامة 
مغل هذا الاستثمار. 


اقتصاد دات السانات المفتوحة: 

هناك عدد من العوامل الكابحة / المثبطة لفتح البيانات» فبعض هذه العوامل تتصل 
بالمخاوف المتعلقة بقضايا الضمان وال مسؤولية» وا مخاوف بشأن الخصوصية والأمن: والحرج 
المحتمل على جودة البيانات أو مداهاء والكفاءة الفنية لبناء واجهات مناسبة لرمجة 
التطيقات (Applications Programming Interfaces- APIs)‏ وإدارة dal‏ التحتية. 
وحتى الآنء فالأمر الأكثر إثارة للقلق. مع ذلك. هو الشأن المالي. فالبيانات قد تكون غير 
متنازعة بطبيعتهاء مما يعني أنه من الممكن توزيعها بتكلفة هامشية. نظريا على JYI‏ 
ولكن ينبغي الدفع مقابل النسخة الأولية جنبا إلى جنب مع إدارة البيانات القائمة وخدمة 
العملاء )2006 عاء20110). وعلى هذا النحو. قد LE‏ السانات المفتوحة موردا Lilas‏ 
للمستخدمين النهائيينء ولكن إنتاجها ومشاركتها وا محافظة عليها هي بالتأكيد ليست دون 
تكلفة معتبرة (خصوصا فيما يتعلق بالتقنيات المناسبة والموظفين المهرة). ففي كثير من 
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الحالات» كانت هذه البيانات أيضا مضدرا رئيسيا للدخل للمنظمات» وف حالة الشركات 
ميزة تنافسية. زمن ثم يرتكز السؤال الأساسي حول كيفية تمويل مشاريع فتح البيانات 
على نحو مستدام في JB‏ عدم وجود jolas‏ الدخل SUL‏ لها. ولذا هناك وجهان لهذه 
المعضلة في التمويل: فمن ناحية هناك التمويل اللازم من قبل الدولة لإنتاج البيانات وجعلها 
مفتوحة. ومن ناحية أخرى هناك التمويل للحفاظ على الطبادرات التي يقودها ال مواطنون: 
والذي يعتمد على العمل التطوعي واممنح» ونماذج الأعمال التى من شأنها تمكين الشركات 
التي تستخدم البيانات المفتوحة من الازدهار والتطور. 

ويختلف Loë‏ خدمات البيانات الحكومية بين البلدان والوكالات. ففي كثير من الحالات» 
تفرض الضرائب لإنتاج ومعالجة البيانات. ولكن في بعض النظم القانونية والحالات» تكون 
خدمات البيانات معقدة يسبب أربعة عوامل: الأول أن إجراءها يتم بالتعاقد عليها مع 
أطراف ثالثة لإدارتها وتشغيلها بالنيابة عن الدولة» حيث يضف الطرف الثالث قيمة 
مخصصة احتكارية أو يجعل البيانات متاحة مقابل رسم Jle‏ وقد حدث هذا مؤخرا مع 
الرموز البريدية الأيرلندية المرتقبة التي سيتم إدارتها من قبل إحدى الشركات نيابة عن 
الدولة وستمول هذه العملية من خلال بيع وترخيص البيانات. الثاني» أن البائعين الآخرين 
يتكتلون بنشاط في سبيل وقف تقديم البيانات المفتوحة لأنه يدمر نموذج أعمالهم. ثالثاء أن 
بعض أجهزة الذولة تعمل باعتبارها صناديق تداول تجارية» فهي لا Lass‏ على كل تمويلها 
من عائدات الضرائب» ولكن جزءا كبيرا من دخلها قائم على بيع البيانات. فهيئة المساحة 
الأيرلندية» على سبيل «JUL‏ تعمل بهذه الطريقة كون أقل من نصف دخلها o‏ مباشرة من 
الدوله في شكل Alel‏ ومن المسلم به أن بعض هذه الدفعات التي تتلقاها gb‏ من وكالات 
حكومية أخرىء ولكنها Gb‏ أيضا من المؤسسات الخاصة وعمليات الشراء الفردية. فإتاحة 
جميع البيانات الخاصة بها مجانا يقوّض قدرتها على العمل وتمويل الخدمات الجارية 
لها. رابعاء أن جعل البيانات مفتوحة لا يتمثل بنشرها في شكل محدّد من قبل الدولة 
فقط. فالكثير من البيانات تحتاج إلى إعادة توظيفها وتنسيقها لتمكينها من أن تكون 
مفتوحة (على سبيل «JULI‏ إبهام ا لمصدر لهاء وتجميعها) ووضع أنظمة جديدة في المكان 
ا مناسب لتحقيق هذا الهدف. وهذه ليست عملية zi‏ وف أوقات التقشف وخفض 
النفقات يعني هذا إعادة تخصيص التمويل لتغطية تمن هذا العملء. الذي هو ضروري 
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أيضا للخدمات الأساسية. وتعني هذه التعقيدات الأربعة أن التصريحات» في كثير من 
الأحيانء بأن جميع بيانات الدولة قد تم بالفعل تغطية كلفها من خلال فرض الضرائب» 
وأنه ينبغي أن تكون متاحة بحرية. هي ليست بسيطة كما يُراد لها أن تكون. آما فيما 
يتعلق بالمبادرات التي يقودها ا مواطنون» فهذه أيضا لديها تكاليف فيما gley‏ بالتوظيف 
والمعدات والخدمات إذا أريد لها أن تكون مستدامة على اللمدى الطو ub‏ فكيفية تأمين 
هذه الموارد خارج نطاق العمل التطوعي والهدايا laus buas JS a‏ حىث تعتمد هذه 
ا منظمات. في الوقت الحاضرء إلى حد كبير على التبرعات الخيرية وتمويل الدولة: والتي لا 
يبحمل U]‏ منها ضمانات للتجديد والاستمرار. ومن ثم» فمن النتائج ا محتملة المترتبة على 
التخفيضات أو التقلبات ف القاعدة المالية لخدمات البيانات المفتوحة الانخفاض ف جودة 
البيانات» وبط e‏ الاستجابة» والابتكار, والأداء العام )2006 (Pollock‏ 

وعموما Jaleó‏ الدعاة للسآئات المفتوحة بان الخار الأفضل ils S Eiin E‏ مستقرة 
للبيانات ال مفتوحة من داخل الدولة وخارجها هوعن طريق الإعانات الحكومية امباشرة 
لتكاليفها. ويرى أنصار هذا النهج أن زيادة الإنفاق العام يعوّض في أربع طرق: الأولى» أن 
إتاحة الوصول المباشر إلى البيانات يحد من بعض التكاليف التي يتكبّدها اممنتجون» مثل 
التوظيف المطلوب للتسويقء واممبيعات» والتواصل مع العملاء ومراقبة شروط وأحكام 
الترخيص )2006 (Pollock‏ الثانية: أنه هكن للنموذج المفتوح الاستفاذة من العمل 
الإضافي الحر والابتكار من جموع ا مستخدمين التي تضيف daS‏ معتبرة إلى مجموعات 
السانات وللمنظمات من ناحية جودة البيانات» وتحليلهاء والمعرفة المستمدة: والمنتجات 
الجديدة والابتكارات» والعلاقات والشراكات التجارية الجديدة );2011 de Vries et al.‏ 
(Houghton 2011‏ الثالثةء آن البيانات ا مفتوحه تنتج قيم فانضة متنوعة للمستهلكينء كما 
تولد dale lelu‏ مهمة تستحق استثمار النفقات العامة فيها )2009 (Pollock‏ الرابعة» أن 
البيانات المفتوحة تؤدي إلى منتجات مبتكرة جديدة من شأنها إنشاء أسواق جديدة: وهذا 
بدوره سوف ينتج مداخيل للشركات وإيرادات ضريبية إضافية. وستكون هذه الإيرادات 
الضريبية فائضة عن التكاليف الحكومية الإضافية في فتح البيانات» وبعبارة أخرى فإن نهج 
التكلفة الصفرية أو الهامشية هي أكثر فائدة على المدى الطويل من إستراتيجيات تغطية 
التكاليف واستردادها (المفوضة الأوروسة 2012 (European Commission‏ 
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JUI الفصل‎ 


ولذاء يعتقد أن فتح البيانات ينطوي على إمكانية إيجاد عدة عشرات المليارات من اليورو 
lisi:‏ في منطقة الاتحاد TOT‏ وحدها duwga)‏ امعرفة ال مفتوحة Open Knowledge‏ 
.(Foundation 2012‏ ومن الأمثلة المستخدمة لدعم هذا الاعتقاد هو قرار الولايات 
امتحدة بإتاحة بيانات نظام تحديد المواقع dhlol‏ والطقس للجمهور بحرية Pollock)‏ 
c» .)2006: de Vries et al. 2011‏ يدعم كل منها صناعات ملیارات الدولارات والتي 
ولك إدراذات daa n5‏ نة وتوظق أعذادا كثيرة من الففمال, 38s.‏ :قدت :الكو تومت 
(The Economist)‏ في العام 2013م بأن GG‏ ملايين وظيفه ف الولايات المتحدة وحدها 
تعتمد على نظام تحديد المواقع. فلو أن أحدا قارن استخدام بيانات الطقس العامة في 
الولايات المتحدة وأوروباء فهناك فرق شاسع في استخدامها وإنتاج قيمة مضافة عنهاء حيث 
يشير )2006( Pollock‏ إلى أنه في حين " تساوي الاقتصادين تقريبا في الخجم فإن صناعة 
أحوال الطقس التجارية في الولايات المتحدة هي أكبر بعشر مرات من نظيرتها في أوروبا كما 
أن صناعة إدارة مخاطر الطقس الوليدة هي Üle SÍ‏ مرة منها في أوروبا”. وبعبارة آخرىء 
تم استخداء البيانات العامة المتاحة علنا با مجان أو بقيمتها الهامشية بطرق أنتجت عنها 
قيمة إضافية كبيرة. فأسواق البيانات المفتوحة تتعلق على حد سواء بأغراض مرتفعة (وهي 
Bas‏ ك دن العملا الذدن يدفعون رسوفا نة £6 مضافة خا علق سيل القال: 
المستهدفين بشكل كبير بالتنبؤات الجوية)» وأغراض منخفضة (وهي تستهدف أعدادا كبيرة 
فق الله حدمي طلا A‏ هه di&a‏ متف ت الد مه مجان : ya dage da‏ آیزاڈات 
الإعلانات؛ على سبيل «JUI‏ تطبيقات حركة ال مرور) )2011 .(de Vries et al.‏ ويتضح 
التأثير المحتمل لفتح بيانات القطاع العام في أوروبا من خلال دراسة أجريت على واحد 
وعشرين مشروغا للبيانات ال مفتوحة في عشرة بلدان والتي وجدت أن الانتقال إلى التكلفة 
الصفرية أو الهامشية لتكلفة العمليات التشغيلية زادت عدد المستخدمين ما بين آلف إلى 
عشرة آلاف ف «5l.‏ كما جذبت العديد من الأنواع الجديدة من اطمستخدمينء ولا سيما 
الشركات الصغيرة والمتوسطة )2011 .(de Vries et al.‏ وهذا يفصح عن أنه على الرغم 
من آن هناك بعض المكاسب II‏ فقد بين )2013( Eaves‏ أن غالبية الإيرادات الناشئة 
ستنتج عن سلسلة طويلة من الادخار والكفاءة والزيادة المتواضعة من التدوير. 
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وعلى e JI‏ من هذه «xod!‏ لم يصدر عن هيئة ا محلفين حكم gbl‏ حول ما إذا كان 
فتح جميع بيانات القطاع العام T‏ اقتصاديا وبشكل مستدام» وخاصة في $44( القصير. 
فهنالك بالتأكيد حالة تتعلق بأن البيانات المفتوحة من الممكن تسويقهاء مما يؤدي إلى 
منتجات عالية ومنخفضة المستوى والتي يمكن بالتأكيد أن تنتج مصادر للدخل وفرص 
العمل. ومع ذلكء وكما بين )2011( «de Vries et al.‏ فإن متوسط ما يكسبه مطورو 
التطبيقات من مبيعاتها سنوياً ليس سوى ثلاثة آلاف دولار فقطء مع الأخذ بالحسبان أن 
ثمانين بالمائة من تطبيقات الأندرويد امدفوعة يتم تنزيلها أقل من مئة مرة. وبالاضافة 
الى «SL JS‏ فقد لاحظوا أنه حتى التطبيقات الناجحة مثل ماي سيتي واي (MyCityWay)‏ 
التي تم تحميلها أربعين مليون 8 تنتج Uso‏ نهد وبدلا من ذلك يستثمر أضحاب 
رؤوس الأموال في مشاريع محتملة الربح مع الحاجة إلى نموذج مستدام للأعمال. وقد 
يكون من الجَيد أن يستغرق الأمر وقتا لتطوير ابتكارات وأسواق جديدة؛ فعلى سَبيل JELI‏ 
استغرقت الصناعات القاثمة على نظم تحديد المواقع سنوات عديدة لتزدهر وتنضج بعد 
قرار جعل البيانات متاحة علنا والذي اتخذ ف العام 1984م. كما قد يكون الحال أن بعض 
السيانات لها قيمة كبيرة T‏ ولكن دون جدوى اقتصادية. مما يستوجب عادة عدم استمرار 
اعانتها مالا إذا أريد لها أن تبقى مفتوحة بطبيعتها. 

وفي JB‏ غياب طرح الاكتتابات الحكومية العامة لجميع التكاليف المتعلقة بفتح البيانات 
الخاصة بهاء يجري النظر في حلول تمويلية محتملة أخرى ولا سيما نماذج الأعمال المختلفة. 
فقد بين )2013( Ferro and Osella‏ انيه نماذج مختلفة لتستخدم: أو قد تستخدم 
لتمويل مبادرات السانات المفتوحة (انظر الحدول .)7١-5‏ ولا تستبعد بعض هذه النماذج 
امختلفة me‏ في حين تعمل نماذج شبه - مفتوحة أخرى على 355« البيانات bilo.‏ لإعادة 
الاستخدام غير التجاري» وإلزام معيدي الاستخدام للأغراض الربحية بدفع مقابل مادي» أو 
الدخول في شراكات بين القطاعين العام والخاص حيث يزوّد القطاع العام البيانات وتقدم 
الشركات الخاصة التمويل والخدمات المضافة لإتاحة الوصول وحقوق إعادة الاستخدام 
às (OECD 2008)‏ نموذج آخرء مكن بناء تحالف elig‏ مجموعة البيانات» وفرق 
العملء واموارد: والأدوات» ويسهل slo‏ القدرات» ولكن يتقاضى رسوم العضوية من أعضاء 
التحالف لتغطية الخدمات ذات القيمة ال مضافة المشتركة. ويتوقف اعتماد أي نموذج. أو 
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مجموعة من النماذج» على المجموعة ا مستهدفة لتحمل تكلفة إنتاج وصيانة البيانات - 
المستخدمينء المحدّثين / البائعين او الحكومة - وإذا كانت ال منظمة تسعى لاسترذاد التكاليف 
كاملة أو جزء هامشيا منهاء أو حتى قيمة أكبر من التكاليف الكاملة التي يمكن استثمارها 
مرة آخر ى ف الخدمة )2013 (Pollock 2009; Ferro and Osella‏ 


الحدول (ع-) 


نماذج التمويل للبادرات البيانات المفتوحة 
الوصف 
pis‏ للمستخدمين النهائيين منتجا Lle‏ المستوى أو الخدمات 
التى تضيف قيمة إلى البيانات ule)‏ سبيل JELI‏ البيانات 
المشتقة» الأدوات والتحليل) مقابل مادي: كدفعة مقطوعة 
«io‏ أو رسوما da) Sio‏ أو الدفع - مقابل - الاستخدآم» ودون 


AIT‏ امميز / خدمة 


Premium product / service 


استخدام حقوق احتكارية. وهذا ex Qu‏ السانات الحصول 
على مزايا اطبادرة والسبق في مجال تسويق وبيع السلع 





تقدم NEN‏ مين النهائيين مجموعة متدرجه من الخيارات» 
متها Jae de) dune] pois. Jacks 0 Das US‏ 
«JULI‏ ميزات محدودة أو Olus‏ من مجموعات (OLLI‏ 
مع خيارات أكثر تقدما تحقق قيمة مضافة بمقابل رسم Jlo‏ 
تفتح المنتج / الخدمة على سوق أكبر اتساعا وأكثر شعبية 
وامزيد من الاستخدام العرضى ا ممتد. مع الاحتفاظ بالخدمات 
/ المنتجات المدفوعة: عالية المستوىء المتاحة للمستخدمين 
الأكثر تخصصا. 
المنتجات مفتوحة ال مصدر تقدم منتجات / خدمات للمستخدمين النهائيين مجانا دون 
Cao «las‏ تدعم من خلال سبل التمويل الأساسية الأخرى 





امنتج Ael‏ / خدمة 






Freemium product / service 








Open source 


أو غيرها من المنتجات / الخدمات. 
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نموذج الهدية الترويجية (البنى يعرض المنتج او الخدمة ابتذاء با مجان أو بقيمة مخفضة 
التحتية على نسق ماكنة الحلاقة | (ماكنة الحلاقة) مما يشجع على المتابعة بالاستخدام ال مدفوع 
والشفرات) مقابل (الشفرات). وقد يكون إتاحة الوصول إلى واجهات 
برمجة التطبيقات با مجانء ولكن يكلف هذا الاستخدام 
امحوسب ال مستخدمين على نموذج دفع المستحقات أولا Job‏ 
(بحسب الاستخدام)» مع دعم هذا النموذج الآخير (الشفرات) 


Infrastructural razor and 
blades 


للنموذج الآول (ماكنة الحلاقة). 

ا منصة الموجهة بالطلب تقدم خدمات ذات قيمة مضافة عن طريق «CAJAS‏ وتكريرء 
وتوحيدء وربط البيانات مما يوفر مجموعة قياسية من 
الأدوات التحليلية: وإتاحتها من خلال متجر شامل (متجر 
الشباك الواحد) وتحميل المستخدمين التكلفة.من خلال 
التسعير المجاني او الممين(تتصاعد تدر یجیاربخټارات 1 و2 
لاكتساب الكفاءة). 
يُعطى مطورو البرمجيات حرية الوصول إلى البيانات لإنشاء 
الخدمات والمنتجات التي يمكنهم بيعها إلى هيئات القطاع 
celsi‏ والتي يمكنها بدورها أن تجعلها متاحة للآخرين من 
خلال نموذج المنتجات امجانية. 
eds‏ المنتتججات!/الخدمات «bles‏ ولكن يتلقى |المستخد مون 
إعلانا عند استخدام exkl‏ / الخدمة )8534 للدخل) أو 
تقدم المنتجات / الخدمات من قبل شركات مختلفة وتوصف 
بالعلامات التجارية لها لتشجيع استخدام منتجاتها وخدماتها 
الأخرى (الدعم المتبادل). 
تطوير العلامة slal‏ يتم إنشاء منتج / خدمة مخصصة للعميل وتخصص 


Demand-oriented platform 








المنصة الموجهة بالتزويد 


Supply-oriented platform 









التوزيع lal‏ مع الإعلان 


\Free with advertising 







لاستخذامه الخاض: مع دقع العميل lagu)‏ طرة:واخدة أو 
اشتراك يتضمن تكاليف الصيانة والتحديث. 


White-label development 





. (Ferro and Osella (2013 المصدر: حمعت من‎ 
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المخاوف المتعلقة بالسانات المفتوحة: 

باستثناء الكيفية اللازمة لتمويل مستدام لمبادرات البيانات المفتوحة. والخسائر 
المحتملة للشركات التى قامت ببناء نماذج أعمال قائمة على إعادة بيع بيانات القطاع العام 
«(de Vries et al. 2011)‏ سيظهر للوهلة الأولى أن هناك عددا WE‏ من السلسات الناتحة 
عن فتح اليانات العامة للجمهور لاعادة استخدامهاء ls‏ هناك العديد من الإيجابيات. 
ومع eUS‏ 433 بدأ à‏ الظهور EXS‏ عدد من الانتقادات ال مضادة التي تزعم أن حركة 
coL UI‏ المفتوجحة ليست محمودة من الناحية d uL ul‏ أو الاقتضادية» حيث إن بعض 
العناصر زائفة في أهدافهاء وعلاوة على ذلكء أن هناك عددا من التبعات الضارة التي 
كن أن تنجم عن فتح البيانات ويتضرر منها بعض المواطنين. ولا توحي هذه الانتقادات 
بفكرة PARI‏ اوو نحو فتح البيانات» ولكن تؤكد على وجوب أن تكون مبادرات 
السسانات المفتوحة أكثر 25[ وتعقلا في إتاحة البيانات. وكيفية استخدامهاء وطرق تمويلها. 
ويمكن تقسيم هذه الانتقادات إلى ثلاث فتات رئيسية: تسهيل البيانات المفتوحة للتوجه 
للخصخصة (تأييد الرأسمالية المطلقة وعدم تدخل الدولة ف الاقتصاد) والهيكلة التسويقية 
للخدمات العامة؛ وأنها تروج لسياسة توسعية وتزيد سلطة المتسلط؛ وأنها تفتقر إلى 
الاستدامة» والأدوات» وسهولة الاستخدام. 


الخصخصة والهيكلة التسويقية للخدمات العامة: 

برهن )2012( Jo Bates‏ على أن «المبادرات ال مفتوحة مثل السانات الحكومية المفتوحة 
(Open Government Data -OGD)‏ تظهر كعملية تاريخية؛. وليست وقائع محايدة». 
فكما هو الحال مع كل المبادرات السياسية» فإن سياسة البيانات المفتوحة ليست ببساطة 
بديهية أو محايدةء بل هي ترتكز على عقيدة سياسية واقتصادية. فحركة البيانات هي 
متنوعة وتتكون من مجموعة من الدوائر الانتخاسة ذات أجندات وأهداف مختلفةء yg‏ 
الدافع من ورائها مجرد أي طرف واحد منها. ومع 43« بينت83]65 ob‏ عامل الشد السياسى 
في حالة حركة البيانات ال مفتوحة في ال مملكة المتحدة كان ue RE‏ بدأت الشركات SII‏ 
تنشط بتكتلها في حملات دعم السانات المفتوحة. وبدأت المبادرات الحكومية المفتوحة 
تنسجم مع برامج التقشف القسري والهيكلة التسويقية للخدمات العامة. فبالنسبة da)‏ 
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قد استولت الأحزاب السياسية وقطاع الأعمال على حركة البيانات المفتوحة لصالح ال مصالح 
الرأسمالية المهيمنة تحت ستار أجندة / جدول أعمال الشفافية )2012 (Bates‏ 


وبعبارة 5,5« فإن جدول الأعمال الحقيقي لقطاع الأعمال هو الحصول على البيانات 
المنتجة بتكلفة باهظة دون أي مقابلء ومن ثم الوصول إلى البنية التحتية المدعومة 
بشكل كبير مما يمكنهم من الاستفادة من الأرباح» وف الوقت 515« إزالة القطاع العام من 
sd‏ اتخائ بوه يشفت Jib laxe‏ يه ا و ddl eli acad‏ 
من خدمات البيانات (كما في الحالات التي جرى تمويلها من الرسوم وليس من دافعي 
الضرائب). ومن ثم اختفاء التمويل اللازم لدعم الإنتاج والإدارة المحلية الداخليةء تم دفع 
هيئات القطاع العام إلى الاستعانة jolas‏ خارجية لمثل هذه الخدمات من القطاع الخاص 
على أسس تنافسية أو التخلي عن إنتاج البيانات للقطاع الخاص التي عليهم بعد ذلك 
شراؤها منهم )2013 dag .(Gurstein‏ يتعين شراء خدمات البيانات والبيانات ا مشتقة 
من البيانات ا مفتوحة المتاحة بحرية من منشئ البيانات» في الوقت نفسه الذي يتم إفراغ 
المعارف الآولة لبيانات المنظمة. وعلاوة على US‏ وحيث إن البيانات ال مفتوحة تتعلق ف 
كثير من الأحيان بأنضطة الهيئّة 5 da‏ وخصوصا هند أشتمالها على مؤشرات قياس الأداء 
الرئيسية» فهي تعمل على تسهيل إصلاح القطاع العام وإعادة تنظيمه مما يعزز الخصخصة. 
وروح الإدارة العامة الجديدة ومصالح القطاع الخاص )2011 (McClean 2011; Longo‏ 
فمثل هذه العمليات» كما بينت )2013( Bates‏ هي جزء من إستراتيجية سياسية مرسومة 
لفتح وإتاحة كافة الخدمات العامة تقريبا للمنافسة بين مزودي الخدمات من القطاع 
الخاص والقطاعات الآخرى» حيث يعمل فتح البيانات الخاصة بالخدمات العامة على تمكين 
مستخدمي الخدمة من استحداث خيارات معلومة ضمن سوق الخدمات العامة على أساس 
التطبيقات التي تعتمد على البيانات التي ينتجها مجموعة من مطورو القطاعات التجارية 
وغير التجارية )2013 التعبير الأصلي). وف مثل هذه الحالات» فإن جدول أعمال الشفافية 
التي يروج لها السياسيون وقطاع الأعمال هو مجرد تعبير مجازيء فإذا كان أي من الطرفين 
مهتما حقا في الشفافية والحكومة المفتوحة فإنه سيكون داعما بالتساوي للحق في حركة 
المعلومات والعمل المتعلق بإفشاء الأسرار )2012 (Janssen‏ وكذلك تخفيف القيود عن 
حقوق الملكية الفكرية على نطاق أوسع )2013 (Shah‏ وبدلاً من «US‏ فإن الحكومات 
والشركات بشكل عام مقاومة لهما على حد سواء. 
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JUI الفصل‎ 


السراسات التوسعية وتمكين الممكن: 

هناك جدل ذو صلة يتمثل ف أن الغالب في à S,»‏ البيانات المفتوحة مدفوع من 
وجهة نظر فنية واقتصادية: ويركز بشكل كبير على إتاحة الوصول إلى البيانات» وليس على 
سياسات البيانات نفسهاء وما قد تكشف عنه» أو كيفية استخدامهاء ولمصالح من Cua‏ 
(Shah 2013)‏ وبعبارة 5,51« تسعى الحركة بشكل كبير إلى تقديم صورة تظهرها على 
أنها محببة وبديهية: وتعزيز الاعتقاد بأن فتح البيانات بطبيعته شيء جيد في حد ذاته. 
وبالنسبة لآخرينء فإن إتاحة الوصول إلى البيانات هو مجرد وجه واحد فيما يتعلق بمفهوم 
Wis «e UNI‏ القدر نفسه من الأهمرة هو ما تتكون البيانات منه» والكيفية التى يمكن بها 
إنشاء مجتمع ASÍ‏ اعتدالا وإنصافا. فإذا كانت حركة البيانات المفتوحة تخدم فقط المصالح 
الر أسمالة من خلال فتح البيانات العامة» وتحتفظ بالبيانات الاحتكارية الخاصة خلف 
أنظمة جدران الدفع Jolie)‏ رسوم الاشتراك) وحمايتها بأنظمة الملكية الفكريةء وتمكن 
بصورة أكبر أولئك الممكنين بالفعل وحرمان الاخرين منهاء فإنها تكون قد فشلت في جعل 
ا مجتمع أكثر دمقراطية وانفتاحا )2013 .(Gurstein 2011; Shah‏ 

ففكرة أن البيانات محايدة وموضوعية في طبيعتها تطرح TA‏ في معظم ال مناقشات 
امتعلقة بالسانات ال مفتوحة S olg‏ إمكانية الوضول لهذه البيانات واستخدامها 
.(Gurstein 2011; Johnson 2013)‏ بيد أن القضية ليست elio I gas UIS‏ لفتح 
السانات نفسها نوكل )2013( dle 4255 5575 Johnson‏ من الامتياز الاجتماعي والقيم 
الاجتماعية الكامنة ضمنا ق بيانات القطاع العام فيما يتعلق بماهية البيانات «Ao‏ 
وتعلقها من وطاذا Y)‏ سيما في المجالات التي تعمل كأنظمة Jio duaa‏ أنظمة الرعاية 
الاجتماعية:. وأنظمة إنفاذ القانون)ء التي Sa‏ حضالهوا هين سحموفة EE PEELE IR‏ 
تلك التي يتم استبعاد مصالحها. وهكذا فإن هياكل القيمة متأصلة في مجموعات البيانات 
والتي تشكل بدورها التصميم والتفسير لها lesg‏ تعمل على نشر اممظام وتعزيز المصالح 
المهيمنة. 

فالمواطنون متفاوتون من حيث إمكانية الوصول إلى الأجهزة والبرامج المطلوبة لتحميل 
ومعالجة مجموعات البيانات المفتوحة: كما أن لهم مستويات مختلفة من المهارات اللازمة 
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لتحليل» وتأطبرء وتفسير البيانات )2011 .(Gurstein‏ وحتى لو امتلكت بعض ال مجموعات 
القدرة على تقديم فهم مقنع للبيانات: إلا أنهم لا ملكون بالضرورة الاتصالات اللازمة 
لاكتساب التأييد الجماهيري والتأثير على النقاش, أو الحنكة السياسية بمقابل خصم جيد 
التجهيز والدهاء. ومن ثم» فإن الدمموقراطية المحتملة للبيانات المفتوحة مفرطة ف التفاؤلء 
إذا أخذ بالحسبان معظم المستخدمين الذين لديهم درجة عالية من المعرفة التقنية وملف 
تعريفي سياسي قائم )2011 (McClean‏ فالواقع أنه يمكن للبيانات المفتوحة أن تعمل على 
زيادة تمكين السلطة وإعادة إنتاجها وتعميق اختلال توازن القوى )2011 .(Gurstein‏ ومن 
الأمثلة التي يستشهد كثيرا بها على هذا الأخير هو رقمنة سجلات الأراضي في ولاية SELS‏ 
(Karnataka)‏ الهند» حيث عمل مشروع البيانات المفتوحة. والذي تم الترويج له باعتباره 
مبادرة لصالح الفقراء» على حرمان الفقراء من خلال تمكين 555( اموارد امالية والمهارات من 
الوصول إلى البيانات التي سبق حجبها وإعادة اقتطاع أراضيهم بوضع اليد بغية الاستيلاء 
.(Gurstein 2011; Slee 2012; Donovan 2012) le‏ لقد سهلت السانات ال مفتوحة 
à‏ هذه الحالةء وبعيدا عن العمل على مساعدة JS‏ المواطنينء على التغيير في حقوق ملكية 
الأرض ونقل الثروة من الفقراء إلى الأغنياء. وبعبارة 5,2« فإن فتح البيانات لا يعني عملية 
متأصلة ف الدممقراطية وتعزيزهاء بل إن الواقع أنه يمكن للبيانات ال مفتوحة أن تعمل أداة 
للسلطة التأدسية )2013 (Johnson‏ 

ومن لمهم هنا أن التنبّه إلى أن إنتاج البيانات الحكومية يكون لأغراض الحوكمة, 
وهي تتألف من نوعين رئيسيين: الأنشطة المتعلقة بأنشطة الدولة والأنشطة المتعلقة 
بالمواطنينء والأماكن: والأعمال. فالنوع الأول يهتم بكيفية عمل الدولةء ueg‏ إتاحة هذه 
البيانات بشفافية» مكن استخدامها لتقييم الأداء والمساءلة. وقد يقف قلة ضد جعل 
Jis‏ هذه البيانات متاحة للجمهورء على الرغم من الحاجة لتقدير مثل سياسات ال مكاشفة 
هذه خاصة إذا كانت التدابير المستخدمة ذات تأثير مشوّه لتقديم الخدمة وتعمل على 
التلاعب ببيانات التقييم (بالتوافق مع قانون كامبل -Campbells Law-‏ انظر الفصل 
السابع)ء وهذا يؤثر بدوره سلبا في ماهية الخدمات المقدمة وجعل الحياة سيئة لأولئك 
الأفشخاص الذين يتلقون الخدمة. ويتكوّن النوع (JI‏ من السجلات الشخصية والمؤسسية 
الحساسة للغايةء وم يتم إنشاؤها بهدف مشاركتها وتبادلها مع الاخرين. وف الواقع. 
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يتوقع ال مواطنون لها أن تكون محمية موجب قوانين الخصوصية وحماية البيانات. وحتى 
عندما يتم تجريد هذه البيانات من البيانات التي تشير إلى هوية أشخاص معينين أي 
جعلها مجهولة (Anonymised)‏ وعرضها مجملة: فإنه مكن للبيانات أن تكون على 
درجة من الحساسية والسياسية بصورة كبيرة. فخذء على سبل JLI‏ بيانات الرعاية 
الاجتماعية والصحية ال منقحة فحنا وامجمعة في وحدات مكانية (على سبيل «JUL‏ مستوى 
الحي)» فهذه البيانات تمثل أداة لتوجيه التدخلات الموجهة الرامية إلى معالجة المعوقات 
الاجتماعيةء كما أن لها إسهامات مفيدة في تحليل البيانات التي تسعي اجتماعيا إلى فرز 
المواطنين والتعريف عنهم فيما يتعلق بالقروض الائتمانية والتأمين ضد المخاطرء ويمكن من 
ثم استخدامها لإنشاء ملفات تعريف مناطقية والتي توصم موضعا ما lods‏ من الاستثمار 
فيه ^" الفصل العاشر). وبعبارة 5,21« مكن إعادة توظيف السانات لأغراض مختلفة 
بطرق شتى (uds‏ لها مخرجات متباينة» وهناك أسباب مشروعة لتوخي الحذر فيما يتعلق 
ما يتم الإفراج عنه من البيانات الحكومية ومقاومة شعار التبسيط ال مستخدم من قبل بعض 
المدافعين عن البيانات ا مفتوحة "إنها بياناتناء لقد دفعنا مقابلهاء وينبغي أن يكون UJ‏ حق 
الوصول إليها . 


الاستدامة والفائدة وسهولة الاستخدام: 

تركز الاهتمام بشكل كبير. حتى OII‏ على جانب توفير الوصول إلى البيانات وإنشاء 
مبادرات البيانات اممفتوحة» وكان هناك عدم إيلاء اهتمام كاف لاستدامة المبادرات والكيفية 
التي يتم بها استخدام البيانات وتوظيفها. ففى دراسة أجريتٍ على عدد من مشاريع البيانات 
المفتوحة ال مختلفة أوضحت )2012( 5b Helbig et al.‏ العديد منها تركز بشدة على doll‏ 
التقنية الفنية» ويمكن فهم هذه المشاريع على WE x y» lpl‏ عن المواقع المرتبطة اغات 
سانات degu‏ ودون أي مراعاة لسهولة الاستخدام: وجودة ام محتوی» أو عواقب استخدامها». 
والنتيجة هي مجموعة من مواقع البيانات المفتوحة التي تعمل أكثر كحاويات للبيانات 
أو مكبات البيانات. بحيث تفتقر إلى الصفات المتوقعة ف البنية التحتية العاملة للبيانات 
وامنظمة du RS‏ مثل السانات النظفة»ء ذات الجودة العالية؛ والتي جرى التحقق من 
صحتهاء وقابليتها للتشغيل المتبادل ا يتوافق مع معايير البيانات ولها التعريف الوصفي 
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ا مناسب ومجموعات تسجيل كاملة (الوثائق ا مرتبطة بها)؛ أي سياسات المحافظة والنسخ 
الاحتياطي والتدقيق؛ وسياسات إعادة الاستخدام والخصوصية والأخلاقيات» والترتيبات الإدارية 
وآليات تنظيم الإدارة والحوكمة؛ والاستقرار JUI‏ وخطة طويلة الأجل للتنمية والاستدامة 
(انظر الفصل الثاني). كما تفتقد العديد من المواقع للآدوات المناسبة وامواد السياقية لدعم 
تحليل البيانات» وعلاوة على ذلك فإن غالب مجموعات البيانات المنشورة تكون صعبة الأخذ 
والاستفادة calis e Euo dgio‏ من تلك التي يسهل نشرها وتحتوي على بيانات غير حساسة 
s‏ أن às luu doas 54505 aJ‏ المقابل: غالبا ما تبقئ السانات الأكر صعوبة Lis‏ 
لجعلها مفتوحة في حالة مغلقة. بسبب قضايا حساسيتها أو لأنها تتطلب المزيد من العمل 
الإدارى للامتثال golgi‏ حماية السانات )2013 .(Chignard‏ 

ويتمثل جزء من المشكلة في أن العديد من مواقع البيانات المفتوحة هي استجابة عنيفة 
وجاهزة لظاهرة ناشتة: وقد تم بناؤها من قبل متحمسين ومنظمات ممن لديهم خبرة 
قليلة في أرشفة البيانات أو الاستخدام السياقي للبيانات التي تم فتحها. وقد تم دعمها 
والترويج لها من خلال الملتقيات المكثفة لمظوري البرمجيات (الهاكاثونات, (Hackathons‏ 
ومنتديات dhol‏ الأسبوعية لمجموعات الاختصاص (Data Dives)‏ التي تعيد eb‏ 
وإنتاج العديد من هذه القضايا. وكما McKeon (2013) and Porway (2013) asi‏ فإن 
هذه الأحداث والتجمعات التي تدعو المبرمجون والأطراف ال معنية الأخرى لبناء تطبيقات 
MUS‏ البيانات المفتوحة لها فائدة محدودة. ففي حين أنها تركز الاهتمام على السانات 
وتغد وسملة جندة للتوؤاضل: MI‏ أن أولتك: الذين يقومون بالترمجة غالا ها يفتقرون إلى 
المعرفة السياقية المعمقة قيما يتعلق مما تشر البيانات 9l «4J]‏ ينتمون إلى مجموعة سكانية 
معينة ليست بالضرورة معبرة عن شريحة مجتمعية أوسع نطاقا (غلى سبيل JELI‏ الشباب 
والمتعلمون والتقنيون)ء ويظنّون أن المشاكل الهيكلية العميقة هكن حلها من خلال الحلول 
التقنية. إنهم «كيان مؤلف من مجتمع صغير من المتطوعين المتحمسينء وليسوا من 
الأشخاص الذين لديهم مصلحة كبيرة في رؤية المشروع ينجح» )2013 .(McKeon‏ وعلاوة 
على US‏ لا تزال الحلول التي تم إنشاؤها في هذه اللقاءات على إصدارها الأول» مع قليل 
من المتابعة بعد انتهاء الحدث ودون تحديث أو صيانة أو تطوير لاحق. وكان جواب 
Jal» «UJ 20118395 (2013)‏ شرع لتغيير مناسب هو الجمع بين أولئك الذين يفهمون 
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البيانات والمشكلات القائمة على أرض الواقع مع أولئك الذين يستطيعون برمجة التطبيقات 
وبنائها والمحافظة عليهاء وقد اقترح )2013( McKeon‏ عقد اجتماعات تخطيطية مسبقة 
وتوصيات توجيهيه بعد الحدث تهدف إلى استدامه ال مخرجات وإنشاء مجتمع على المدى 
الطويل. وبعبارة 5,21« هناك حاجة للتوفيق بين الخبرات الموجودة والخبرات في تطوير 
التطبيقات. والحاجة نفسها مطلوبة مع مواقع OLLI‏ امفتوحة» حيث تتطلب تعلم 
الدروس المستفادة من أولئك الذين عملوا لفترة طويلة سابقة ف الأرشفة وقطاع أعمال 
تاذل البيانات: kaata‏ ذلك أفتاء المحفوظات الأرشيفية والعلماء والجغرافيون. 

ونتيجة لهذه القضابا العويصة ال مختلفة: ودلا من إنشاء دورة (Virtuous Cycle) dolos!‏ 
بحسب ما تفترض حركة البيانات ال مفتوحة. حيث الإفراج عن امزيد والمزيد من مجموعات 
البيانات» في 2o 5L‏ من اللفسكال والصيغ: ينتج die‏ مزيد من الاستخدام: ومن ثم الإفراج عن 
المزيد من البيانات مستقبلا إلا أن العديد من المواقع, كما لاحظت )2012( Helbig et al.‏ 
cale‏ من انخفاض معدلات التصفح لها وتراجعها لأنها لا تشجع على الاستخدام 9l‏ لا تقدم 
التسهيلات للمستخدمين في هذا الخصوصء وتقتصر خدماتها على عوامل أخرى مثل ممارسات 
إدارة البيانات وعرض الجهد المؤسسي المبذول والسياسات الداخلية المعمول بها. فبعد الشرارة 
الأولى من الاهتمام» تراجع استخدام البيانات بشكل ملحوظ للغاية بسبب الكشف عن القيود 
المفروضة على البيانات ومحدوديتها ونضال المستخدمين من أجل إيجاد طرق LAS‏ استخدام 
وتحليل البيانات بشكل مربح. وقد لاحظ )2011( McClean‏ على سسل JELI‏ أن التحليل 
celil‏ عن السانات المفتوحة كان له تأثير محدود على النقاشات السياسية: وخلص فيما 
يتعلق alio‏ المعلومات ال مجمعة على الإنترنت (كوينز (COINS‏ الخاص بالبيانات اطالية 
الحكومية ف ا مملكة المتحدة: إلى أنه بعد 

هبّة قصيرة من اهتمام وسائل الإعلام في منتصف عام 2010ء $g‏ أعقاب إطلاقه.... 
فإن التقارير التي تشير صراحة إلى نظام كويْنز غدت الآن نادرة للغايةء كما أن العاملين في 
الصحافة الذين كانوا الأكثر اهتمامًا بالحصول على حق الوصول إليه قد صرّحوا بأنه م تثبت 
فائدته كمحرّك فاعل للصحافة على وجه الخصوص. 
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وحيث يتم نشر البيانات دوريا على سبيل «JU XLI‏ بصورة فصلية أو سنوبة» فإن 
الاستخدام SE GU T‏ دوريا وغالبا مرتبطا مشاريع محددة مثل التقارير الاستشارية 
بدلا من وجود نمط أكثر ثباتا من الاستخدام الذي قد يتوقعه المرء لبيانات تتغير بطبيعتها 
W‏ بصورة مستمرة أو لديها قيمة اقتصادية dle‏ ففي Jis‏ هذه الحالات» لاحظت 
Helbig et al. (2012)‏ أن مجموعة من حلقات ;393 الفعل السلبية قد أبطأت توفير 
البيانات واستخدامهاء ومن ثم زيادة خفض الاستخدام. dig‏ فبعد بعض «ال مكاسب 
السريعة» الأولية» يكمن الخطر في تحؤل أي دورة إيجابية من كونها إيجابية إلى سلبية 
وتقويض الأساس المنطقي لتمويل الحكومة المركزية طثل هذه المبادرات وكونها عرضة 
للتوقف المفاجئ. إن المفتاح لتجنب نشوء مثل هذه الدورة السلبية هو التأكد من 
تركيز أي مبادرة بأكبر قدر ممكن على جانب الطلب كما في جانب العرضء وأنها توفر 
للمستخدمين بيانات قابلة للتشغيل اطتبادل والآدوات التحليلية وغيرها من الخدمات 
التي تسهل استخدام وإضافة قيمة للبيانات: بدلا من مجرد ربط الملفات: 


الخلاصة: 

عند أحد المستويات» تعد قضية البيانات المفتوحة والبيانات المرتبطة بديهية - حيث تسهم 
البيانات المفتوحة في صنع الشفافية والمساءلة والمشاركة والاختيار والابتكار الاجتماعي والكفاءة 
والإنتاجية وتعزيز الحوكمة والابتكار الاقتصادي وتكوين الثروات. في حين تعمل البيانات ال مرتبطة 
على تحويل ا معلومات الموزعة عبر شبكة الإنترنت إلى شبكة دلالية يمكن من خلالها القراءة الآلية 
للبيانات وربطها معا. aleg‏ تحمل البيانات المفتوحة والبيانات المرتبطة في طياتها الكثير من 
الوعود والامال والقيمة مع اعتبارها "kx‏ محفوفة با مخاطرء فواقع الحال بالنسبة للبيانات 
امفتوحة والسانات المرتتطة أكثر 3 TR‏ > كما أن الأسس الاقتصادية لها ليست واضحة على 
الإطلاق. ويبدو أن للبيانات المفتوحة والبيانات ا مرتبطة تكاليف هامشية ALJ‏ ولكن dalol‏ 
قائمة في عملية إنتاجها والطاقم الفني والجهاز المؤسسي لتسهيل استخدامها والحفاظ عليها مما 
يلزم تكاليف حقيقية من حيث العمالةء واممعدات» واموارد. وق الواقع. فإن البيانات المفتوحة 
بعيدة كل البعد عن كونها مجانيةء ولكن حتى «OVI‏ م يتم وضع نموذج متماسك لتمويل مستدام 
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الفصل الثالث 


مبادرات البيانات المفتوحة دون إعانة حكومية. كما أن فوائد البيانات المفتوحة من حيث إنتاج 
قيمة مضافة على فائض الاستهلاك والمشاريع التجارية الجديدة: والمنتجات المبتكرة, والتكاليف 
قد قابلها إيرادات ضريبية إضافية افتراضية إلى حد كبير أو بدأت بالتحقق فقطء وعلاوة على 
«US‏ فإن العواقب السلبية المحتملة لفتح البيانات لم تستكشف بعد بالكامل. 

فهناك حاجة إلى الدفع بمزيد من الاهتمام النقدي لكيفية تطور مشاريع البيانات المفتوحة 
كظاهرة dui‏ اجتماعيه مقعدة ومرتبطه بطائفه متنوعة من البرامج. وا معنيين. واصحاب 
المصلحة. وحتى OI‏ تمحورت الجهود حول العمل السياسي والتقني المتعلق بإقامة مشاريع 
البيانات المفتوحة؛ وم يتم العمل بشكل كاف على دراسة هذه التحركات المادية (ls‏ تلامس 
العديد من الجوانب وعواقبها. ونتيجة لذلكء فإننا نفتقر إلى دراسات الحالة التفصيلية لتطبيق 
مشاريع البيانات المفتوحة. والتجمعات المحيطة بهاء والتي تعمل على صياغتهاء والطرق 
الفوضوية. والطارئة والعلائقية التي تتكشف مرور الوقت. ولن تظهر صورة أكثر اكتمالا 
للبيانات المفتوحة والبيانات المرتبطة إلا من خلال Jis‏ هذه الدراسات التي ستكشف عن كل 
من الإيجابيات والسلبيات لمثل هذه المشاريع وتوفر إجابات عن أسئلة معيارية بشأن الكيفية 
التي ينبغي تنفيذها بها ومعالجة قضايا الاستدامة وسهولة الاستخدام والسياسات المتعلقة بها. 
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البيانات الكسرة (Big Data)‏ 


تتبع )2012( Francis Diebold‏ منشأ استخدام مصطلح «البيانات الكبيرة» إلى منتصف 
التسعينيات )19908( حيث استخدم لأول مرة من قبل جون (John Mashey) $l‏ 
كبير العلماء السابق المتقاعد من شركة سيليكون غرافيكس. للإشارة إلى معالجة وتحليل 
مجموعات البيانات الضخمة. وقد كان المصطلح قليل الجذب ف البداية. ففي العام ٠٠١8‏ 
استخدم عدد قليل دا من الناس مصطلح «البيانات الكبيرة»» سواء في المجالات الأكادمية 
أو الصناعة. ونعذ خمس سنوات أصبح مصطلح «البيانات الكبيرة» التعبير الطنان الأكثر 
شيوعا في الاستخذام في دوائر الأعمال ووسائل الإعلام dius JI‏ مع تعليقات دورية في 
الصحف الأكثر انتشاراء مثل صحيفة النيويورك (New York Times) zeb‏ والفاينانشال 
تامز «(Financial Times)‏ ومقاطع وأعداد خاصة في المجلات العامة والمجلات العلمية 
مثل عام الاقتصاد (Economist)‏ والوقت (Time)‏ والطبيعة (Nature)‏ والعلوم 
(©©5612). لقد كان هذا الانتشار وزيادة الاستخدام ال مرتبطة به هو ما أذى بالفعل إلى 
إعلان غارتنر (Gartner)‏ فى plo‏ )2013( عن انتقال تقنية البيانات الكبيرة على طول دورة 
الدعاية (Hype cycle)‏ (كما يطلق عليها نموذج النضج التقني) من مرحلة «ذروة تضخم 
التوقعات» إلى «مستوى خية الأمل» )2013 ؛ مع إعلان بعض الدعاة سابقا عن 
موت «البيانات الكبيرة» بصفته bolus‏ ذا qq uix‏ حيث c‏ أصبح ا Leii‏ وواسع 
النطاق للغاية في de) cà» sl‏ سبل (de Goes 2013 «JUL‏ فبعض lgl‏ الشركات 
التي تبنت المفهوم تصارع من أجل تحويل الاستثمارات في البيانات الكبيرة إلى عوائد ربحية 
والبعض يشككون في فوائدها المحتملة. ومع ذلك» JB‏ قطاع الأعمال والقطاع الحكومي 
العام وممولو البحوث على قناعتهم بارتفاع منحنى التنوير (Slope of Enlightenment)‏ 
للبيانات الكبيرة مجددا إلى مستوى الإنتاحبة (Plateau of Productivity)‏ عبر دورة 
الإعلان أو نموذج النضج التقني» بل وأكثر من eUS‏ أنها وجدت لإحداث تغيير جذري في 
كيفية عمل العلوم واجراء الأعمال )2013 ;Siccular‏ انظر أيضا للفصلين السابع والثامن). 
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Ss‏ نوقش في الفصل الثاني فقد وجدت ولفترة طويلة من الزمن مجموعات ضخمة من 
بيانات عبر الحكومات والصناعات والأوساط الأكادممية التي تم استخراج ال معلومات منها 
من أجل تقديم مزيد من الرؤى والمعرفة: فالإدارات والوكالات الحكومية أنتجت بشكل 
روتيني كميات ضخمة من البيانات. على سبيل JULI‏ قامت إدارة ال محفوظات والسجلات 
الوطنية في الولايات المتحدة في عام ٠١١١‏ بتخزين ما يقارب 0,£ مليون قدم مكعب من 
الوثائق المادية من وكالات السلطة التنفيذية الأمريكية» وا محاكم:. ومجلس النواب» ومقر 
الرئاسة (وهي خمسة ف المائة من سجلات الحكومة الاتحادية) مما يضيف ثلاثين آلف 
قدم بصورة خطية سنويا )2013 «Ellis‏ بالإضافة إلى خمسمائة تيرابايت من البيانات 
الرقمية. كما تم بالمثل جمع بيانات للشركات عن عملياتهاء والأسواق» والعملاء وقواعد 
بيانات هائلة من البيانات العلمية التي تمّ جمعها ومشاركتها من بداية العلم الحديث. 
لذلكء ما المقصود من مصطلح «البيانات الكبيرة»: بالنظر إلى كميات البيانات الناتجة 3 
امجالات السابقة؟ 

فكما هو شأن العديد من المصطلحات المستخدمة للإشارة إلى الاستخدام المتسارع في 
التقنيات وال ممارسات. لا يوجد تعريف أكاديمي محدد أو صناعي متفق عليه للمصطلح 
البيانات الكبيرة: إلا أن الكثير من التعاريف الشائعة تشر إلى الثلاثية المكررة للأحرف 
الابتدائية (3Vs)‏ للخصائص المميزة للبيانات الكبيرة: الحجم (Volume)‏ والسرعة 
(Velocity)‏ والتنوع )2012 (Variety) (Laney 2001; Zikopoulos et al.‏ فالبيانات 
الكبيرة تتميز بأنها: 
ه ضخمة في الحجم» آي تتكوّن من تيرابايت أوبيتابايت من البيانات. 
ه عالية السرعة» أي أنها تنشأ بشكل آني أو $39« أو قريبا من الزمن الحقيقي. 
o‏ مختلفة من حيث تعدد تنوعهاء حيث تتنوع البيانات بين المنظمة وغير المنظمة في 

طبيعتهاء كما تتنوع في الغالب من حيث مرجعيتها الزمانية واممكانيه. 

فخلال زمن ما قبل البيانات الكبيرة. تقيدت قواعد البيانات بين هذه الخصائص الثلاث: 
حيث كان من الممكن لقاعدة البيانات الجمع بين خاصيتين اثنتين في ان واحد (ضخمة 
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السانات الكبيرة 


وسر ds‏ متنوعة وسر cds‏ وكبيرة ومتنوعة) )2012 .(Croll‏ إلا أنه مع تعزيز قدرة امعالجه 

الحاسوبية: والتصاميم الجديدة لقواعد البيانات» والتخزين الموزع (انظر الفصل الخامس). 

أصبح تحقيق الثلاثة مجتمعة في وقت واحد ممكنا مما يتيح أشكالا جديدة للتحليل 

وتفديم عروض مفصله للغاية للنظم الضخمة وامتغيرة باستمرار. وعدا عن الخصائص 

العلاك الننايقة: coy La‏ اللؤلفات الصاذرة هوخا إن غدة مق الخضائص الرئيسية 45591 

حيث تتميز البيانات الكبيرة Lail‏ بالميزات التالية: 

o‏ شاملة في نطاقهاء حيث تسعى لتغطية كامل مجتمع أو نظم الدراسة (ن = الجميع)ء أو 
على الأقل توفر حجم Si olus‏ من تلك التى يجري استخدامها في دراسات البيانات 
التقليدية أو الصغرة. 

٠‏ متناهية في دقتهاء حيث تهدف إلى أن تكون مفصّلة قدر الإمكان» ومفهرسة بشكل فريد 
في تحديد الهوية. 

e‏ علائقبة بطسعتهاء كونها 3 تحتوي على حقول بيانات مشستركة GSE‏ من الربط بين 
محموعات سانات مختلفة. 


LLG حيث تحمل سمات التفرع (مكن إضافة حقول بيانات جديدة بسهولة) مع‎ dipa o 

التوسع (يمكن التوسع في حجمها بسرعة). 

boyd and Crawford 2012; Dodge and Kitchin 2005; Marz and Warren) 
.(2012; Mayer- Schonberger and Cukier 2013 

وبالنظر إلى الحملة الدافعة إلى التحويل الرقمي (Digitisation -4 243 Jl)‏ للبيانات 
التقليدية الصغيرة والتوسع فيها ضمن البنى التحتية الرقمية التي تتميز بالضخامة والتنوع 
مثل ال محفوظات الأرشيفية «iilo gl‏ التعدادات السكانية: وا مجموعات الثقافية والاجتماعة 
التراثية؛ انظر الفصل (YEI‏ فقد كانت السرعة والخصائص الإضافية هي ما ميزت البيانات 
5JI‏ ,5 وجعلت منها bli‏ استثنائا )1997 (Christensens‏ وغير بصورة جذرية طبيعة 
البيانات وما مكن عمله من خلالها (انظر الجدول .)١-١‏ فعلى سبيل «JULI‏ يتميز المسح 
الأسري الوطني بكبر الحجم. والدقة المتناهية؛ وقوة العلائقية:. إلا أنه يفتقر إلى السرعة 
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(تتغير البيانات مرة واحدة في السنة )» والتنوع (يتكون من ثلاثين سؤالا منظما)» والشمول 
(حيث تقتصر العينة على فرد واحد من عشرين أسرة)ء والمرونة (كون حقول البيانات 
ثابتة ولا تتغير خلال ا مسوحات المتعاقبة للتمكن من تحليل السلاسل الزمنية). ففي هذا 
الفصل تم إيراد الخصائص السبعة للبيانات الكبيرة ويناقش الفصل التالى العوامل المساعدة 
للبيانات الكبيرة ومصادرها. 


:(Volume) الحجم‎ 

شهد العقد الماضي انفجارا في كمية البيانات التي & إنتاجها ومعالجتها بشكل يومي. 
وكما عنونت مجلة وايرد (Wired)‏ بشكل رئيس في عددها الخاص للعام 2008: نحن ندخل 
«عصر s) «Cala!‏ الواقع» لقد ولجنا بالفعل في pas‏ الزيتابايت؟ (cob 70٨2‏ وقد 
سعت العديد من الدراسات لتقدير وتتبّع الأحجام المعنية (Ae)‏ سبيل Hilbert and Jbl‏ 
.(López 2009; Gantz and Reinsel 2011; Short et al. 2011‏ واستخدمت هذه 
الدراسات منهجيات وتعاريف مختلفة» ولكنها أجمعت بالكلية على أن معدل نمو البيانات 
کان EET‏ في نطاقه. وعلاوة على «AUS‏ فهي å él‏ على gal‏ باطراد أكير قي الملستقبل 
المنظور. إن أبسط طريقة لتوضيح هذا gaill‏ هو إعطاء بعض الأمثلة على تقديرات عامية 
لأحجام البيانات وبعض التقديرات المتعلقة بكيانات محددة: ولتوفير إطار مرجعي» يفصل 
الجدول (£-Y)‏ بصورة مختصرة كيفية قياس حجم البيانات. 

الجدول )*-£( 


بت (b)‏ صفر lgl‏ هى اختصار لتعبير «الخانة الثنائيه»» حيث تستخدمه 
الحاسبات لتخزين ومعالجة البيانات على صورة الرمز 
الثنائي )0 (1l‏ 


obl äs FER cob‏ ثنائية | مساحة 445525 كافية لتمثيل رموز الأبجدية الإنجليزية 








(8 بت) والأرقام باستخدام الرموز الثنائية 
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cob أو210‎ 0 


0 كملوبايت؟ 
cob 220‏ 





السانات الكيرة 


من كلمة «الألف» (Thousand)‏ باليونانية. فالصفحة 
الواحد من yal‏ المطبوع تقدر بحوالي 2 كيلوبايت 
من dadls‏ «صخم» (Large)‏ باليونانية. فكامل أعمال 






شكسبير الأدبية يقدر حجمها ب 5 ميجابايتات في حين 
يقدر حجم الملف الصو ال موسيقي بحوالي 4 ميجابايت 
من كلمة (Giant) «Jla»‏ باليونانية. ففيلم من ساعتين 
يمكن ضغطه في ملف حجمه 2-1 غيغابايت 


0 مبجابايت؛ 
cob 230‏ 














من كلمة “عملاق' (Monster)‏ باليونانية. فالكتب 
ا مفهرسة في مكتبة مجلس النواب الأمريكي (الكونغرس) 
يقدر حجمها بحوالي 15 تيرابايت 


بيتابايت (PB)‏ | 1000 تيرابايت؛ 250 | تقدر بيانات JS‏ الرسائل التي تم توصيلها من قبل خدمة 
البريد الأمريكى في العام 2010 بنحو 5 بيتابايت. 


cab 
ege ا‎ 
.) 116 Economist) cob 260 (EB) 
لصي م‎ pOWA. Cue ren 
cob 270 


بحوالي 1.2 زيتابايت 


حالياً هي قيمة أكبر من التخيّل 


0 غيغابادت؟ 


(TB) تيرابايت‎ 
cab 240 


















يوتابايت (YB)‏ | 1000 زيتابايت؛ 


cob 280 





تم وضع الاختصارات من قبل المنظمة الحكومية الدولية ántergovernmental organization‏ 


وال مكتب الدولي للأوزان والمقاسيس International Bureau of Weights and Measures‏ تم 
إضافة وحدى يوتابايت وزيتابايت فى العام 1 ؛ المصطلحات للكميات الأكير e‏ بتم وضعها Aso‏ 





المصدر: مجلة عاط الاقتصاد (2010) (The Economist)‏ تم إعادة إنتاجها بإذن عام الاقتصاد. صحيفة ble‏ 
الاقتصاد المحدودةء لندن: الإصدار 11 مارس 2014 

وقد بين )2012( Zikopoulos et al.‏ أنه في العام ١٠٠٠م‏ تم 02359 Cobb Assess‏ 
من البيانات ف العالم. وبحسب التقرير السنوي e$ e$ -Short et al. (2011: 7) J‏ 
امعلومات؟ - عالجت خادمات العام للعام aY- A‏ 9.57 زيتابايت من ال معلومات... وكان 
هذا معدل W‏ غيغابايت من المعلومات يوميا للعامل العاديء أو نحو Y‏ تيرابايتات من 
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المعلومات uale: dd‏ سنا وقامت الشركات ف العام معالحة Y‏ ترانانتا من المعلومات 
د باستثناء المصادر غير المحوسبة: وبحلول عام «e ٠٠٠١‏ قدرت مؤسسة el‏ جي اي 
(MGI)‏ (بحسب ما ذكر 3 :2011 oL (Manyika et al.‏ الشركات عالميا قد قامت بتخزين 
اكثر من V‏ إكسابايت من البيانات الجديدة على الأقراص الصلبة ... في حين قام المستهلكون 
بتخزين أكثر من 1 إكسابايتات من البيانات الجديدة على أجهزة من قبيل أجهزة الحاسب 
الشخصية وأجهزة الحاسب ال محمولة. كما قذروا كذلك أنه في «e ۲۰۰۹ ele»‏ كان ما يقرب 
من كل القطاعات ف الاقتصاد الأمريك لا يقل بياناتها ا مخزنة بالمتوسط عن 7٠١‏ تيرابايت 
من OLLI‏ لكل شركة فيها أكثر من آلف موظف. كما امتلكت العديد من القطاعات أكثر 
من 1 ستابايت من السانات ال مخزنة لكل شركة». وق عام e Y*W‏ أشار Neelie Kroes‏ 
مفوّض الاتحاذ الأوروبي لجدول الأعمال الرقمي.ء بأن V‏ مليون بليون cab‏ من البيانات 
يجري توليدها في الدقيقة الواحدة على مستوى العام )2013 (Rial‏ 


وبناء على مراجعة )2011( Manyika et al.‏ لنمو حجم البيانات. فقد لودو 
leu;‏ بنسبة -€ المائة في نمو البيانات التي يتم إنشاؤها على مستوى العام baia‏ 
وقدر )2011( daS» ob Gantz and Reinsel‏ امعلومات التي تم م ]23 LS 3L‏ واعادة 
نسخها (تكرارها) على الإنترنت ستتجاوز VA‏ زيتابايت 554b 5 VA)‏ غيغابايت) à‏ 
العام ٠١١١‏ مخزنة في ٠٠١‏ كوادريليون (مليون مليار) ملف بيانات». gwg‏ هذا الذي 
ذكروه lod‏ مقدار تسعة أضعاف خلال خمس سنوات فقطء مع نمو متوقع ف ذات 
الوقت إلى أكثر من الضعف كل سنتين. ونتيجة UU‏ فقد توقعوا في تقريرهم بأنه في 
العقد JWI‏ 

سيزداد عدد الخوادم (الافتراضية والفيزيائية) في جميع أنحاء العام بعشرة أضعاف. 
فرعن loj ae‏ كمية اللخلومات: اللدازة ق bye‏ کر بات الشركات مقدار خسن suh‏ 
وسيزداد أعداد الملفات التي سوف تضطر مراكز البيانات إلى التعامل معها بمقدار 75 ضعفاء 
على الأقل. 


ومثل هذا النمو الهائل E‏ إنتاج البيانات» ادعت شركة اي IBM (2012) elu‏ 
AR» oLo‏ من السانات à‏ العام اليوم قل تم « à LS SL Z3!‏ العامين اماضين فقط» 
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كما توقع )2012( Zikopoulos et al.‏ أن تقارب أحجام السانات Yo à»‏ زيتابايت 
بحلول عام aY- Ye‏ 

ويمكننا إدراك وقوع هذا الانفجار ف إنتاج البيانات الرقمية من خلال النظر في بعض 
الأمثلة المحددة. فشركة تك أمريكا (TechAmerica)‏ قدرت ab‏ يجري RN‏ ارسال ما 
يقرب من 114 Llo‏ رسالة بريد الكترونية و٤۲‏ مليار رسالة نصيةء كما يتم اجراء W‏ مليار 
مكامة هاتفية على مستوى العا )2013 (Strohm and Homan‏ ووفقا لشركة سيسكو 
(CISCO)‏ ففي العام ۲ م كان هنالك تقرننا ما ٠١ zalo‏ مليارات عنصر (أجهزة اتصال 
ومستشهعرات) مشكلة شكة إنترنت الأشياء (Internet of Things -IoT)‏ والتى يقوم كل 
منها بإنتاج كميات متغيرة من البيانات» مع الزيادة المتوقعة لهذا الرقم ليفوق الخمسين 
Jalos bids‏ عام .(Farber 2013) a Y:Y-‏ أما ما alei‏ بحركة الاتصال على الإنترنت» 
وقد LU‏ ت شركة جوجل تعالج ‏ مليارات طلب استعلام للبحث drag‏ وتقوم بتخزينها 
(Mayer-Schonberger and Cukier 2013) I‏ وقرابة Yé‏ ستادايت من السانات 
كل يوم )2012 às (Davenport et al.‏ العام «e ۲١١١‏ قضى المستخدمون النشطون 
موقع التواصل الاجتماعي فيسبوك أكثر من ٩,۳‏ مليارات ساعة خلال شهر Manyika et)‏ 
(al. 2011‏ وبحلول عام ۲۰۱۲ ie‏ ذكرت الشركة بأنها كانت تعالج Y,O‏ مليار من مختلف 
أنواع بيانات ال ملحتوى (وصلات. مخازن» صورء آخباں وما إلى Y, Vs (S‏ مار من ردود 
الإعجاب وتلاقمائه مليون dulas‏ تحميل للصور .(Constine 2012) Loi‏ كما تم إنتاج 
ا أربعمائة ملبون تغريدة nid‏ في العام ١١١٠م ٠‏ معدل زيادة مقداره مئتان 
في sia GUI‏ مع احتواء JS‏ تغريدة على تلاثة وثلاثين T‏ من السانات الوصفية 
لها )2013 .(Mayer-Schonberger and Cukier‏ ود AI‏ من هذه البيانات غير 
منظمة بطبيعتها. وبامثل هنالك انفجار في حجم إنتاج البيانات ال منظمة قد وقع Ae La‏ 
سبيل «JULI‏ وفيما يتعلق ببيانات تجارة التجزئة الخاصة بالأوراق المالية والمبيعات: والتي تم 
جمعها من خلال السلاسل السوقية (اللوجستية) ومنافذ البيع» أنتجت سلسلة متاجر وول 
مارت (Walmart)‏ أكثر من Y,o‏ بيتابايت من السانات المتعلقة بأكثر من مليون Ales‏ خاصة 
بالعملاء في كل ساعة ف العام aY- NY‏ «أي يفوق ما يعادل VV‏ مرة من المعلومات الواردة 
في جميع الكتب ال مصنفة في مكتبة الكونغرس»؛ 6 :2012 (Open Data Center Alliance‏ 
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كما أنتجت متاجر تسكو (Tesco)‏ البريطانية أكثر من ١,0‏ مليار دندا دنا من بنود السانات 
كل شهر ف العام ٠١١١‏ م )2011 (Manyika et al.‏ 


وبالمثلء تنتج الحكومات والهينات العامة كميات هائله من البيانات حول مواطنيها 
والدول الأخرى. على سبيل «JL‏ بدأت cols‏ التنقل والعبور في مراقبة التدفق المستمر 
للناس من خلال أنظمة النقل» على سبيل «JUL‏ جمع زمن ومكان استخدام بطاقات السفر 
مسبقة الدفع مثل بطاقة أويستر في لندن. كما يجري الآن تقديم العديد من نماذج وطرق دفع 
الضرائب أو طلبات الحصول على الخدمات الحكومية من خلال الانترنت» ففي العام 82009« 
أنتجت حكومة الولايات المتحدة AEA‏ ستابايت من السانات (مؤسسة التقنية الأمريكة 
.(TechAmerica Foundation 2012‏ كما تعمل وكالات الاستخبارات الست عشرة التي 
تشكل أمن الولايات basal‏ جنبا إلى جنب مع فروع الجيش الأمريكيء على مراقبة وتخزين 
وتحليل كميات هائلة من البيانات كل ساعة. من خلال آلاف المحللين العاملين في تدقيق 
وتفسير النتائج. وللحصول على فكرة عن حجم بعض مشاريع الاستخبارات العسكرية؛ فإن 
مشروع النظام المستقل للمراقبة الأرضية الصورية الحقيقية (ARGUS-IS)‏ والذي كشفت 
عنه وكالة مشاريع البحوث المتطورة الدفاعية (DARPA bylo)‏ وجيش الولايات المتحدة في 
العام ٠١١1‏ م» هو منصة للمراقبة بالفيديو بدقة ١,8‏ غيغابايت والتي يمكنها بيان التفاصيل 
الصغيرة حتى ست بوصات من ارتفاع a.) AJS Veee s‏ كِلومترات) )2013 (Anthony‏ 
چ ۸ مليار بكسلء في ۱۲ إطارا في الثانية ) لقطة في الثانية )» مما ينتج ما يقارب 

٠‏ غيغابت ف الثانية. Jole liag‏ نحو 1 بيتابايتات من البيانات يوميا. وباستخدام 
الحاسوب العملاق. مكن للنظام إجراء التحليل LT‏ من خلال تتبّع ما يصل إلى 10 جسما 
متحركا ضمن مجال الرؤية. liag‏ هو مشروع واحد فقط في ترسانة ال مشاريع الاستخباراتية 
المماثلة وذات الصلة. 

وبالمثل: فيما يتعلق با مشاريع العلميةء يتكوّن تسلسل الجينوم البشري من نحو ٠٠١‏ 
غيغابايبت من السانات )2012 :(Vanacek‏ وهذا يتضاعف عر الآلاف من الأفراد مما 
يوسع قاعدة البيانات قريبا إلى تيرابايت وبيتابايت من البيانات. وعندما بدأ التشغيل 
في مسح سلوان الجوي الرقمي (Sloan Digital Sky Survey)‏ في العام 5٠٠١‏ أنتج 
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المرقاب (التلسكوب) ف نيومكسيكو من بيانات الرصد والطمراقبة في Jal‏ شهرين أكثر مما 
سبق جمعه ف تاريخ ele‏ الفلك حتى ذلك الوقت )2010 (Cukier‏ وقي عام e ٠٠٠١‏ 
بلغ حجم أرشيفها ما يقارن ١2١‏ تيرابايت من البيانات» وهي كمية سيتم قريبا جمعها 
كل duad‏ أيام من قبل المرقاب الكبير للمسح الشامل Large Synoptic Survey)‏ 
(Telescope‏ والذي نكا العمل به قي شيلى $ العام 2016 Slo .(Cukier 2010)e‏ 
ضخامة من dis‏ مصادم هادرون الكبير (Large Hadron Collider)‏ والذي es»‏ بإنتاج 
٠‏ تيرابايت من البيانات في الثانية الواحدة )2010 .)1he Economist,‏ وق dis‏ 
وغيره من الحالات» يتم إنشاء بيانات هائلة للغاية لا مكن تحليلها أو تخزينهاء بحيث 
تعد بيانات عابرة. وق الواقع» لا وجود لهذه القدرة التخزينية لكل هذه البيانات» فعلى 
الرغم من التؤسع السريع في القدرات التخزينية» إلا أن هذا التوسع لا يمكنه مواكبة إنتاج 
السانات )2011 .(Gantz et al. 2007: Manyika et al.‏ 


الشمول :(Exhaustivity)‏ 
تستخدم عملية انتقاء العينات في دراسات البيانات الصغيرة من أجل إنتاج مجموعة 
dolo‏ تمثيلية لمجتمع الدراسة من جميع البيانات ال محتملة في وقت معين ومكان معين. 
وتستخدم عملية انتقاء العينات من مجتمع الدراسة بسبب كبر هذا المجتمع وتعذر جمع 
كافة البيانات المتعلقة به لمحدودية الوقت واطوارد ا مخصصة. ف اممقابل» تسعى مشاريع 
البيانات الكبيرة إلى التقاط بيانات كامل مجتمع الدراسة (ن = (SUI‏ أو على الأقل» حجم 
áus‏ أكير من امعتادة في دراسات البيانات الصغيرة Mayer-Schonberger and Cukier)‏ 
3. فمن ناحيةء تعد هذه البيانات نتاجا ثانويا للتقنيات التي استخدمت في إنتاج 
الياناث: Lio‏ إلى جنب مع النمو الهائل في القدرة على تخزين البيانات (انظر الفصل 
الخامس). ومن ناحية أخرىء هناك قناعة بأن "الأكثر هو أفضل" وسيقدم تمثيلا أكبر ومزيدا 

من الدقة والصحه ق التحليل. 

وق النظم امفتوحة Jis‏ المشاريع العلمية الكبيرة. US‏ التى تقس السانات AU‏ 
للإبلاغ عن الطقس ونمذجة الأرصاد isgal‏ أو جمع البيانات الفلكية باستخدام مرقاب 
قوي» يكون التوجه نحو مجموعات بيانات أكبر SL‏ مع زيادة أحجام العينات عبر العديد 
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من المتغيرات ما أمكن ذلك. ولا يعني ذلك في ele‏ الفلك: على سبيل المثال» مجرد جمع 
بيانات «sl‏ ولكن أيضا البيانات من مختلف ألوان الطيف الكهرومغناطيسيء وبدقة 
عالية لأكبر قدر ممكن. أما في حالة النظم المغلقة. مثل الفيسبوك أو شراء السلع من 
متجر على شبكة الإنترنت مثل أمازون أو إرسال رسائل البريد الإلكتروني؛ فمن ال ممكن 
تسجيل كافه التفاعلات والعمليات التي «ass‏ بالإضافه إلى مستوى عدم التفاعل. وق 
هذه الحالات» هذا هو الواقع بطبيعة Jll‏ فموقع التواصل الاجتماعي الفيسبوك يقوم 
بتسجيل كل نشرء أو تسجيل لإعجاب» أو رفع لصورة يتم تحميلهاء أو وصلة إلى موقع 9 
أو رسالة مباشرة أو لعبة لعبتء أو فترات الغياب» وما إلى ذلك لكل مستخدميه الذين 
ناهزوا المليار أو نحو ذلك. وبامثلء لا تسجّل شركة الأمازون فقط تفاصيل كل عملية شراء 
والمشترين:»:ولكن أيضا جميع الروابط التي تم زيارتها وكل السلع التي 3 استعراضها من 
خلال موقعهاء بالإضافة إلى كافة البنود التي تم وضعها في سلة التسوق وم يتم شراؤها. 
كما يتم تسجيل كافة رسائل البريد الإلكتروني من قبل الخادمات التي تستضيف صندوق 
البريد الإلكتروني للعميل» وتخزين كامل البريد الإلكتروني وجميع البيانات الوصفية ال مرتبطة 
به على سبيل JUL‏ الذين تم إرسال البريد الإلكتروني لهم أو استلامه «eaa‏ والوقت / 
التاريخ» c£ solls‏ واملفات ا مرفقة. وحتى لو تم تحميل البريد الإلكتروني محلياً على جهاز 
المستخدم وتم حذفه فما زالت نسخة محفوظة dis‏ على الخادم» هذا مع احتفاظ معظم 
امؤسسات والشركات بهذه السانات لعدد من السنوات. 

وبالمثل بالنسبة للأشكال الأخرى من البيانات» فقد نمت البيانات المكانية بشكل كبير في 
السنوات الأخيرة» وذلك من خلال الاستشعار الآني عن بعد والصور الراداريةء إلى ا مشاريع 
الكبيرة مكتظة المصادر مثل مشروع خرائط الشوارع المفتوحة (OpenStreetMap)‏ 
وا مسارات اطمكانية الرقمية التي تم إنشاؤها بواسطة مستقبلات أنظمة تحديد المواقع 
الجغرافية ال مضمّنة داخل الأجهزة. ويهدف الصنفان الأولان إلى أن يكونا شاملين مكانياء 
بحيث تجمع التضاريس للكوكب الأرضي بأسره» ورسم خرائط البنية التحتية لدول بأكملها 
وتوفير مجموعات بيانات مشتركة ومرخصة للخرائط. ف حين يوفر المشروع الثالث القدرة 
على تتبّع وتعقب الحركة عبر الفضاء بمرور الوقت؛ وبناء مسارات الزمن - الفضاء التي يمكن 
تجميعها لتوفير نماذج الزمن - الفضاء للسلوك عبر مدن ومناطق بأكملها. وتمكن مجتمعة 
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من النمذجة ال مفصّلة للأماكن وطرق التنقلء والمقارنة المسحية عر الفضاء واستهداف 
التسويق مجتمعات duszo‏ وتقديم خدمات جديدة معتمدة على الموقع: والبيانات التي 
مكن الجمع بينها لاشتراكها في المرجعيات اطكانية لإنشاء قواعد بيانات وتطبيقات جديدة 
يمكن البحث مكانيا فيها (على سبيل JELI‏ جمع البيانات حول منطقة لإنشاء ملفات 
تعريف للحي). 

وبالنظر إلى التقدم الحاصل في سعات التخزين (انظر الفصل الخامس). يبدو أننا قد وصلنا 
إلى مرحلة بحيث يكون من الأسهل في كثير من الحالات تسجيل JS‏ شيء» دون الحاجة إلى فرز 
البيانات» وتدقيقهاء وأخذ عينات منهاء وتسجيل ما يحتمل أنه مفيد منها فقط (ومن الذي 
يعرف ما يشت احتمال آنه مفيد في المستقل؟). وكما أشار )2012( y» :Zikopoulos et al.‏ 
عجب أننا نغرق في البيانات» فإذا كنا نستطيع تتبع وتسجيل شيء ماء فإننا بالعادة نفعل». 
وفي الواقع, أشار )7 :2012( Dumbill‏ إلى أن Tul‏ الأساسي خلف البيانات الكبيرة هو «عندما 
daz as‏ احتفظ بكل شيء».. ويتجلى هذا بالاعتقاذ بأنه كلما كان المزيد من البيانات lola‏ 
سنحت فرص أفضل لصنع رؤية أكثر صحة ونفاذا... وفرص العثور على «المنتجين» لنظرية 
جديدة John Seely Brown)‏ مقتبس من 8 :2010 Bollier‏ ). وعلى الرغم من ذلك. تسهم 
إستراتيجية السعي نحو الشمولية بشكل كبير في طوفان البيانات» ويتمثل التحدي الأكبر في 
رؤية hal‏ الشامل والصورة الكبيرة من جملة التفاصيل وتمييز الغث من السمينء وإثارة 
مجموعة من الأسئلة الأخلاقية فيما يتعلق بنطاق البيانات التي يتم إنتاجها والاحتفاظ بها 
والاستخدامات التي يجري توظيفها فيها أو من الممكن توظيفها فيها (انظر الفصل العاشر). كما 
أنها تثير تساؤلات معرفية أساسية )2012 (Floridi‏ على سبيل JELI‏ وبالنظر إلى شموليتهاء 
تساءل )2012( Callebaut‏ عما إذا كانت تحليلات البيانات الكبيرة هى علم ما بعد الاختزال 
«(Post-reductivist)‏ وسيتم مناقشة هذه الأسئلة مزيد من التفصيل في الفصل الثامن. 


الدقة والتبويب/ الفهرسة (Resolution and Indexicality)‏ : 
بالإضافة إلى شمولية البيانات» أصبحت البيانات الكبيرة 351 تناهيا في الدقة بكثير 
وهاتان الخاصيتان يدفعان جميعاً في الاتجاه نحو التبويب/ الفهرسة القوية (عنونة 
بوسم مميز وتحديد للهوية) )2005 (Dodge and Kitchin‏ وتعد صور الاستشعار 
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عن يُعد مثالاً على تعزيز الدقة, ففي أواخر الثمانينيات» كانت أعلى دقة للصور المتاحة 
لمعظم الباحثين غير الحكوميين عن سطح الأرض هي لتلك الصور التي التقطتها أقمار 
لاندسات (Landsat Satellites)‏ الصناعية. حيث تمثل كل نقطة digó‏ (بكسل) قطعه 
من الأرض تقدر ٠٠١ x Y*‏ متراء في حين أن الكثير من الصور المتاحة على جوجل إيرث 
ذات دقة تصل إلى ٠,١ × ۲,١‏ مترء مما يتيح عرض المزيد من التفاصيل وتحليلها. 
وبا لمثلء فيما يتعلق بمخرجات بيانات التعداد السكاني. فقد زاد علو درجة البيانات 
في العديد من الدول. ففي الحالة الأيرلندية» كان نشر بيانات التعداد حتى وقت 
قريب للدوائر الانتخابية ( ۲,٤٠۹‏ منطقة بمتوسط ١70١‏ نسمة ف كل dgio‏ حيث 
كانت الكثافة السكانية لكل دائرة انتخابية del‏ بكثير في dabl‏ والبلدات وأقل في 
المناطق الريفية). وف العام Y «VY‏ تم وضع بيانات التعداد بتوزيع جغرافي جديد سمي 
بالتجمعات الصغيرة. التي بلغ عددها NAEM‏ تمثل الوحدات الجديدة بالعادة بيانات من 
Yo* - ٠‏ من .(Gleeson et al. 2009) AI‏ وقد أتاحت التجمعات الصغيرة إجراء تحليل 
التعداد على مستوى الحي أو الشارع» بدلا من مساحات شامتتعة jus‏ ومناطق ذات 
أعداد متساوية Ln‏ من السكان التي مكن مقارنتهاء مما يوفر فهما أكر للتجمعات 
السكانية والاقتصاد الأيرلندي. TT‏ ق تحري المزيد من Aöl‏ يجمع العديد من 
وكلاء / سماسرة البيانات كميات كبيرة من البيانات المتعلقة بالأفراد والأسر التى تمكن 
الشركات من استهدافهم بشكل فردي بالسلع والخدمات (انظر الفصل الثاني). 
وقد صاحبت الزيادة في دقه البيانات: الزيادة في تحديد الهويات للأشخاصء وال منتجات». 
وامعاملات» والأقاليم بحيث أصحت باناتها أكثر فون وفهرسة Us deo‏ (انظر الفصل 
الخامس). فعلى سبيل «JULI‏ تحمل معظم السلع ال معروضة للبيع في متاجر التجزئة الكبرى 
في الوقت الحاضر الرمز الشريطي (الباركود)» وهيّز هذا الرمز ا منتج» ولكن ليس كل وحدة 
منه على حدة - حبث تشترك كل زجاجات صابون شعر الرأس (الشامىو) من نفس العلامة 
التجارية (الماركة) في نفس الرمز - مما يعني أنه لا يمكن التمييز بينها بشكل فردي. 
وفي «oll‏ تتميز زجاجة صابون شعر الرأس الموسومة بشريحة تحديد الهوية باستخدام 
موجات الراديو (Radio Frequency Identification Device- RFID)‏ بشكل $, «JA‏ 
OS‏ لكل شريحة رمز فريد من الممكن قراءته عن بعد بواسطة جهاز استشعار الذبذبات 
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الراديوي. ونتيجة لذلك» يمكن تتبع كل زجاجة من مكان صنعها من خلال سلسلة التوريد 
وحتى المتجر وسلة العميلء مما يوجد مسار للتدقيق المفصل. وبعبارة 9,2« فقد أصبح 
من الممكن تتبّع الأمور الفردية بدقة عبر الزمان والمكانء Le‏ في ذلك أولئك الذين يعملون 
على نقل أشياء من مكان لآخر. وبالمثلء بالنسبة للمعلومات» وخاصة تلك التي في شكل 
رقميء حيث يتم تعريفها بشكل فريد من خلال رموز إدارة الحقوق الرقمية Digital)‏ 
(Rights Management‏ فعلى سبيل «JUL‏ مکن تعيين معرفات الكائن الرقمي Digital)‏ 
(Object Identifiers- 5‏ إلى الأعمال الإبداعية المتوفرة على الإنترنت (كالتقارير 
«Xa‏ الصورء الصوت» وملفات الفيديو)ء فمعرفات الكائن الرقمى هي محدد هوية دائم 
مرتبط باسيانات diogi‏ مثل عنوان الإنترنت (Universal Resource Locator- URL)‏ 
الذي يشير إلى موقع الملف. ويعزز استخدام ا معرّفات الفريدة العلائقية والقدرة على ربط 
وضم البيانات معاء كما يوفر وسائل عملية لفرز ورصد ومطابقة وتمثيل الكائنات Lyon)‏ 
:2003a; Dodge and Kitchin 2005; Graham 2005‏ انظر Lai‏ الفصل العاشر). 


:(Relationality) 45M Jl 
مختلفة بروابط بعضها مع‎ Ollo تتمثل العلائقية بمدى القدرة على ضم مجموعات‎ 
بعض وكيف ممكن اسستخدام هذه الروابط للإجابة عن أسئلة جديدة. فالعلائقية هي‎ 
في صميم قواعد البيانات العلائقية (انظر الفصلين الثاني والخامس). وهي القدرة على‎ 
إنشاء بيانات غاية في العلائقية التى تدفع بسوق البيانات الواسع وأرباح وكلاء البيانات‎ 
وشركات اطلفات التعريفية (انظر الفصل الثاني). إن الدرجه العاليه من العلائقيه هى‎ 
وكيف تتغير عر‎ dol G لفهم التركيبة السكانية‎ lue TNT lS JI ما يجعل التعداد‎ 
ميل تلك التي‎ el الزمان والمكان. وتختلف دراسات البيانات الصغيرة فى مدى علائقيتهاء‎ 
تنطوي على البيانات المنظمة لدرجات أعلى من الترابط من تلك البيانات غير المنظمة.‎ 
وهذا يستدعي القول إنه ينبغي وجود شكل من أشكال العلائقية بين البيانات لاستخلاص‎ 

التفسيرات والاستنتاجات الشاملة منها. 
وعلى الرغم من أن البيانات الكبيرة لا تستخدم غالبا بنية قاعدة بيانات علائقية 
(انظر الفصل الخامس)» فإن ميزة أساسية في طبيعتها هي العلائقية القوية. وكما Ja‏ 
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boyd and Crawford (2011: 2)‏ فإن «البيانات الكييرة مترابطة بشكل أساسيء وتنبع 
قيمتها من الأنماط التي يمكن استخلاصها من خلال guo‏ روابط بين أجزاء من «LI‏ 
عن i55‏ أو أفراد على علاقة بآخرينء أو مجموعات من الناس» أو ببساطة عن هيكل 
تنظيم المعلومات نفسها». إلا أنها وخلافاً لقواعد البيانات العلائقيةء فهي تتقن بالتساوي 
التعامل مع البيانات غير الرقمية (الرمزية)» والبيانات غير المنظمة كما البيانات ال منظمة: 
والربط (yo‏ النوعن les‏ وتعظيم القيمة المستفادة من التقاطعات بينها. ومن 99« أصبح 
من الممكن الربط بين مجموعات degi‏ من البيانات - الشخصيه» والعملية»ء والتفاعلية 
والاجتماعية: واطالية: واطكانية» والزمنية» ...إلخ - وتحليلها على أساس فردي وجماعي 
للعلاقات والأنماط. 

وقد ثبت جلياء كمثال على قوة هذه العلائقيةء الاستخدام المكثف للبيانات الكبيرة في 
الحملات الانتخابية للرئيس الأمريكي أوباما في العام ۲۰۰۸م و۲٠١۲م.‏ فعلى النحو الذي 
Tssenberg (2012) alá‏ سعى فريق أوباما لتحديد وتتبع جميع جوانب حملاتهم 
الانتخابية في ٠٠١8‏ م و١٠١۲ «e‏ ووضع سلسلة كاملة من المقاييس التي تم تسجيلها 
والتنقيب فيها بشكل مستمر للحصول على معلومات» وأنماط واتجاهات مفيدة. واشتمل 
ذلك على مراقبة صارمة للإجراءات الخاصة بهمء مثل وضع الإعلانات عبر وسائل الإعلام 
ا مختلفة. وإجراء حملات بريد الإلكترونية. والاتصال الهاتفي بالناخبين ا محتملينء وطرق 
الأبواب وفرز الاصوات الانتخابية للمناطق» وتنظيم الاجتماعات وا مسيراتء وتتبع الذين 
كانوا قد تحدثوا إليهم وماذا قالوا أو ما التزموا به. وقد عززوا هذه ا معلومات Olis‏ 
التجارب العشوائية واسعة النطاق المصمّمة لاختبار فعالية مختلف طرق إقناع الناس على 
التصويت لصالح أوباما أو التبرع بالأموال لحملته. وجمع فريق أوباما بين جميع ا معلومات 
التي نتجت فيما تعلق بالناخبين وبيانات التسجيلء والتعداد السكانيء والبيانات الحكومية 
الأخرى» ومسوحات الاقتراع» وبيانات جرى شراؤها من طيف واسع من الموردينء ما في 
ذلك وسطء البيانات ووكالات التصنيف الائتماني» وشركات التلفاز الخطي (Cable TV)‏ 
وكانت النتيجة مجموعة من قواعد البيانات الضخمة عن كل الناخبين في البلاد تتكون مما 
لايقل عن ثمانين من المتغيرات )2012 (Crovitz‏ وأكثر من ذلك» أنها ترتبط بالخصائص 
الدهوغرافية للناخبين المحتملينء وتاريخ انتخابهم» وكل حالة من حالات تواصلهم مع 
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حملة أوباما وردود آفعالهم» والتاريخ الاجتماعي والاقتصاديء وأنماط سلوكهم واستهلاكهم 
ووجهات النظر والآراء التي تم الإعراب عنهاء مع تحديث قواعد البيانات يومياً خلال 
الحملة بكل بيانات جديدة يجري إنتاجها أو شراؤها. إما في الحالات التي لا يعرف فيها 
محللو أوباما الانتماء السياسي للناخب» ولا يمكنهم فيها الوصول إلى ذلك من خلال الاتصال 
ا مباشر معه» فإنهم يوظفون خوارزمية متطورة تستخدم المتغيرات التي بحوزتهم عن 
شخص ما gul‏ عن التصويت ال محتمل ال مفضل له )2012 .(Issenberg‏ وكانت النتيجة 
مليارات من أجزاء البيانات المترابطة والتي استخدمت للتعريف بالناخبين بشكل $253« 
وتقييم مدى احتمالية قيامهم بالتصويت والكيفية التي يصوتون بهاء والكيفية التي قد 
يستجيبون بها لمختلف السياسات والقصص. لقد أنشأً الترابط بين البيانات في حملة 
أوباما ما alhol‏ عليه )2012 (Crampton et al.‏ مصطلح «تأثير تضخيم المعلومات» 
«(Information Aplifier Effect)‏ حيث مجموع البيانات اکر من الحا 


السرعة :(Velocity)‏ 
هناك فرق جوهري بين البيانات الصغيرة والبيانات الكبيرة يتمثل في الطبيعة الديناميكية 
لإنتاج البيانات» فالبيانات الصغيرة تتكوّن عادة من الدراسات التي تكون مؤطرة بقالب 
جامد من حيث الزمان والمكان. وحتى في الدراسات المطؤلة» يتم التقاط البيانات في أوقات 
متفرقة ذات فاصل زمنى (على سبيل «JULI‏ كل بضعة أشهر أو سنوات). فعلى سبيل «JUI‏ 
يتم إجراء التعدادات السكانية بشكل عام كل خمس أو عشر سنوات» وف المقابل يتم 
إنشاء البيانات الكبيرة على أسس أكثر استمرارية بكثيرء وف كثير من الحالات بشكل 3l‏ أو 
لحظي وبشكل مباشر بالتقارب من الوقت الحقيقي للوقوع ES . (Real-Time)‏ ع 
قدر ضئيل ومتفرق من البيانات» التي تجمع أو تعالج dà ace‏ فإن البيانات الكبيرة تتدفق 
بسرعة. ولذلك كان هناك انتقال ف التعامل من ال معالجة بالدفعات (Batch processing)‏ 
إلى LUI‏ المتدفقة )2012 .(Streaming Data) (Zikopoulos et al.‏ فمن Amb‏ 
يسهم هذا في مسألة كبر حجم البيانات من خلال إنتاج بيانات بسرعة SÍ‏ ومن ناحية 
5,51« فهو يجعل كامل دورة البيانات أكثر ديناميكية بكثيرء ويبرز LAS LLA‏ إدارة نظام 

السيانات امتغير باستمرار. 
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وتنبع السرعة من التكرار المستمر لتسجيل المشاهدات مع مرور الوقت و/أو تغير 
المكان )2009 (Jacobs‏ مع كون العديد من الأنظمة في وضع التشغيل الدائم باستمرار 
(Dodge and Kitchin 2005)‏ فعلى سبيل «JULI‏ تسجل المواقع الإلكترونية بيانات كافة 
الزيارات التي تمت للموقع والأنشطة التي قام بها الزائر خلال تصفحه على الموقع؛ كما 
تقوم المعدات الطبية بمراقبة العلامات الحيوية باستمرارء وتسجّل الكيفية التي يستجيب 
بها الجسم للعلاج وتُطلق إنذارا في حال تجاوزت هذه العلامات i>‏ معين؛ وتتعقب شركات 
الهاتف ال محمول digag gigo‏ وطبيعة استخدام الأجهزة الموصولة على شبكاتها كل بضع 
ثوان؛ وبالمثل ترصد شبكات استشعار الطقس مؤشرات الغلاف الجوي كل بضع دقائق 
وترسل نتائجها إلى قاعدة بيانات مركزية لإدراجها في الاستطلاعات الجوية؛ ويسجل جهاز 
استشعار الذبذبات الراديوي (Transponder)‏ على طول طرق امدينة البرية والسكك 
الحديدية هوية الحافلات والقطارات التي تمرٌء مما يتيح لسلطة النقل العام معرفة أماكن 
مركباتها في آي وقت» واحتساب الوقت المقدّر للوضول في محطات التوقف المختلفة؛ كما 
تراقب متاجر التجزئة مبيعات الاف المنتجات ال مختلفة للآلاف من العملاء حيث تستخدم 
البيانات «لعرفة أوقات إعادة dus‏ الرفوف وطلب دفعات جديدة من الموردين؛ ويتواصل 
الناس بعضهم مع بعض من خلال مواقع وسائل التواصل الاجتماعي في سيل لا ينتهي 
من التادلات والعلاقات البينية المتشابدكة؛ ويرصد ال مرقاب (Telescope)‏ باستمرار السماء 
لقياس التقلبات في موجات الراديو من أجل فهم أفضل لطبيعة الكونء ففي كل هذه 
الحالات» هناك تيار مستمر من البيانات التي تتطلب إدارة وتحليلا مستمرا. 

ويشكل نقل وإدارة كميات كبيرة من البيانات المنتجة باستمرار تحديا تقنيا بسبب 
التحديات الناشئة عن محدودية قدرة سعة التخزين مما يوجد اختناقات بشكل سريع 
في d S,»‏ مرور وتبادل البيانات. على سبيل «JULI‏ وكما أن فيديوهات موقع اليوتيوب 
(YouTube)‏ قد تتوقف أو يتأخر عرضها بسبب كون سعة قناة الاتصال بالإنترنت ليست 
كافية لتواكب سرعة تدفق البيانات ا لمطلوبء فإن الأثر نفسه مكن أن يقع في حالة جمع 
ومعالجة OLLI‏ حيث تكون الأنظمة عاجزة عن مواكبة تدفق السانات. وتشمل حلول 
هذه ال مشكلة زيادة سعة SLS‏ الاتصال. وتوظيف تقنبات فرز وضغط البيانات مما بقلل 
من حجمها ومن ثم وقت معالجتهاء وتحسين كفاءة خوارزميات ال معالجة وتقنيات إدارة 
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البيانات. كما Jie‏ تحليل سيل البيانات المتدفقة تحديا أيضاء لأن النظام لا يسكن ف أي 
لحظة ueg‏ أي «dla‏ كما في حالات الأسواق «AU‏ حيث هكن أن يكون تحليل الصفقات 
لمايكرو ثانية من الزمن LS‏ للغاية. وهناء تستخدم خوارزميات معقدةء إلى جانب العرض 
ا مرني للبيانات الديناميكية وهي في حالة تغير مستمرء لتتبع وتقييم النظام. 


التنوع :)Variety)‏ 
قد تختلف البيانات الصغيرة والبيانات الكبيرة في طبيعتهاء كونها منظمة» أو غير منظمة 
أو شبه منظمة» وتتألف من الأرقام» النصوص, الصورء الفيديوء وغيرها من أنواع البيانات 
الأخرى. إلا أن هذه الأنواع المختلفة من البيانات يرجح أن تكون ف البيانات الكبيرة أكثر 
قابلية للجمع والربط بينهاء وإمكانيه Log‏ البيانات اممنظمة بالبيانات غير المنظمة. فعلى 
سبيل «JUL‏ تتألف نشرات الفيسبوك من النصوص التي ترتبط في الغالب بصوز أو ملفات 
فيديو أو غيرها من quels‏ وهي تجتذب تعليقات مستخدمي الفيسبوك الآخرين؛ كما 
قد تجمع شركة ما بين البيانات المالية المتعلقة با مبيعات واستطلاعات العملاء التي تعر 
عن مدى ثقتهم بالمنتج. وف LEL‏ تكون البيانات الصغيرة أكثر انفصالا وترتبط» على 
كل حالء من خلال مفاتيح تعريفية وحقول بيانات مشتركة. ويتمثل السبق الأساسي 
بالنسبة للبيانات الكبيرة في كيفية اختلافها عن الأشكال التي سبقتها لإدارة البيانات «ds JI‏ 
والتى كانت احترافية للغاية في معالجة وتخزين البيانات الرقمية باستخدام قواعد البيانات 
العلائقية» مما مكن من إجراء مختلف أنواع التحليل الإحصا. إلا uil‏ كانت أضعف بكثير 
في dleil‏ مع نماذج البيانات الغير رقمية. عدا عن مجرد تخزينها في ملفات مجردّة أو 
مضغوطة. وكما لاحظ اتحاد مراكز السانات ال مفتوحة )7 :2012( Data Center Alliance‏ 
b‏ في السابق كان يجري تجاهل البيانات غير ا منظمة: أو في أحسن الأحوالء استخدامها 
بشكل يفتقر إلى الكفاءة. ومع US‏ فإن التقدم Loll‏ في الحوسبة «Ae oll‏ وتصميم 
قواعد البيانات باستخدام هياكل عوضا عن لغات الاستعلام الهيكلية (NoSQL)‏ (انظر 
الفصل الخامس)ء والتنقيب ف البيانات وتقنيات اكتشاف المعرفة (انظر الفصل السادس)ء 
قد زادت بشكل كبر القدرة على إدارة ومعالجة واستخراج ال معلومات من البيانات غير 
المنظمة. وف الواقع» يجري على نطاق واسع تداول أن ما يقارب تمانين ف المائة من جميع 
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البيانات الكبيرة ھی غر منظمة بطبيعتهاء وكما أبان )2011( (Grimes‏ فقد أصبح هذا 
الرقم مسلّما به مع قليل من الإثبات. 


المرونة (Flexibility)‏ : 
يكون تصميم البحث وإدارة البيانات» مع مشاريع البيانات ial‏ غير مرن نسبيا 
مجرد بدء العمل الميداني والتحليل» وذلك بالنظر إلى الخدمات اللوجستية: والتكاليف. 
والحاجة إلى التمثيل في dus‏ صغيرة الحجم. فعلى سبيل JALI‏ فإنه من الضروري على كل 
شخص تم gaz‏ بيانات التعداد له تعبئة النموذج ذاته للتأكد من إمكانية قابلية مقارنة 
البيانات عبر BE‏ السكان. وبمجرد طباعة النماذج» لا هكن إضافة حقول بيانات جديدة: 
مما يعنى ثبات البيانات ال ممكن استخراجها من هذه التماذج. وبامثل Lë‏ قواعد SEL I‏ 
العلائقية التي تحفظ بها البيانات إلى أن تكون LB‏ ثابتا ومحدودة النظاق. وعلى نحو 
مماثل. يكون تصميم البحث isle‏ في التجارب العلمية والدراسات البيئية» غير مرن بمجرد 
بدئهاء وذلك بهدف تمكين إجراء عمليات المقارنة والتكرار. أما في الدراسات التي تعتمد 
المقابلات أو الأنشطة الاجتماعية» فمن الممكن للباحثء على الرغم من ذلك» أن يكون أكثر 
مرونة في النهج المتبع؛ ils‏ يكون لديه نموذج حر من الأسئلة وإمكانية التكيف مع الأوضاع 
المستجدة. وممكن أن يكون ترميز وإدارة وتحليل هذه البيانات LA lisa‏ ولكن هذا يعود 

جزثيا إلى محدودية حجم ونطاق مجموعة البيانات. 

في المقابلء تمّ تصميم نظم البيانات الكبيرة لتكون مرنة بطبيعتهاء بحيث تحمل 
سمات قابلية الاستطالة والتفرع (ممكن إضافة حقول بيانات جديدة بسهولة) وقابلية 
التوسع )6 5$ التوسع بسرعة) بغض النظر عن الحجم )2012 .(Marz and Warren‏ 
ويعني استخدام قواعد البيانات غير الهيكلية للاستعلام (NoSQL)‏ إمكانية إدارة البيانات 
المتغيرة بسرعة le‏ والتكيف مع حقول البيانات الجديدة (انظر الفصل الخامس). 
وهذا يعني أنه من ا ممكن التكيّف مع إنتاج البيانات على أسس تدويرية» وأداء الاختبار 
على التكيف. فعلى سبيل المثالء تقوم شركات جوجلء والفيسبوك» ومنصات أخرى 
على الإنترنت بتعديل تصاميمهاء وجمع بيانات حول كيفية استجابة المستخدمين لهذه 
التغييرات على سبيل (JUL‏ مراقبة الزيارات العابرة gigt‏ وتحليل النتائج واستخدامها 


٤۲‏ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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لتقديم مزيد من التعديلات المحسنة للتصميم بغية تشجيع إجراءات وردود معينة 
بشكل مستمر. ولأن أعداد الأشخاص الذين يستخدمون هذه ال مواقع Ala‏ وأحجام 
العينات الخاصهة بهم كبيرة Te‏ فهذا يعني أن بإمكانهم إجراء التغييرات دون الخوف 
من فقدان التمشل. على سبل «JULI‏ وبالعودة إلى حملة باراك أوباما الانتخابية: 
فقد أجرى فريق حملته تجارب متتالية عن مدى فعالية التعديلات المحسنة موقع 
الحملة 53b J (BarackObama.com)‏ المشاركة»ء والعمل التطوعي» والتترعات. فأحد 
الاختبارات قيّم اثار التغيير على زر «اشترك» إلى «مزيد من الممعلومات» و «انضم إلينا 
«OVI‏ و«اشترك الآن»: وأصبح من الواضح على مدى BEW‏ ألف زيارة أن استخدام زر 
«انضم إلينا الآن» قد أدى إلى عشرين ف امائة زيادة ف الزائرين المقبلين على التسجيل 
في اطوقع )2012 (Issenberg‏ 

فمثّل هذه المواقع الكبيرة الحجم ينبغي أن تكون أيضا قابلةاللتوسع والتطوير 
وقادرة على التعامل مع الطفرات الناشئة في طلب وإنتاج البيانات» حيث يتسبب مقدار 
حركة مرور البيانات في انهيار قاعدة البيانات العلائقية التقليدية العاملة على خادم 
واحد. فعلى سبيل «JULI‏ يمكن أن يزداد عدد التغريدات التي يتعامل معها تطبيق 
التواصل الاجتماعي تويتر بشكل ملحوظء مع عشرات الالاف من التغريدات التي يجري 
نشرها JS‏ بضع ثوان أثناء الأحداث الكبيرة» مثل حفل افتتاح الألعاب الأوطبية أو خلال 
المباراة النهائية. وكان الحل هو تركيب أنظمة oke‏ تتألف من أجزاء موزعة بحيث 0553 
البيانات في قواعد بيانات مقسمة عبر العديد من الخوادم: مما يمكن من توسيع نطاق 
التخزين بحسب الحاجة. وعلاوة على ذلك» ففي بعض الأنظمة. مثل تويترء يمكن تعيين 
المرونة من قبل ال مستخدمين لتحديد ما إذا كانت تشمل البيانات آم لا. على سبيل «JULI‏ 
يقرر المستخدمون في العديد من تطبيقات وسائل التواصل الاجتماعي وامتنقلة glo»!‏ 
أو عدم إدراج مواقعهم» وكذلك البيانات التعريفية الرئيسية الأخرى المتعلقة بالهوية 
.(Gorman 2013)‏ 
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الخلاصة: 

البيانات الكبيرة هي ظاهرة حديثة»ء وبالنظر إلى التطبيق والانتشار المتسارعين لهاء فقد 
نرت اتقاكبنات Baza‏ خول US as la‏ الثانات اة جاتن اللرقطة ها وك 
بعض التعاريف» مثل تلك التي تنص على أن البيانات الكبيرة هي أي مجموعة بيانات 
كبيرة جدا بالقدر الذي لا مکن معه تخزينها في جدول بيانات إكسل أو على جهاز واحد 
(Strom 2012)‏ مبتذلة للغاية وغير مفيدة» حيث تخفض مستوى مفهوم البيانات الكبيرة 
إلى خاصية الحجم فقط. لقد أصبح من الواضح أن لدى البيانات الكبيرة عدد من الخصائص 
الملازمة لها والتي تجعلها مختلفة Leg‏ عن الأشكال السابقة من البيانات» وتم في هذا 
الفصل مناقشة الخصائص الأساسية السبعة للبيانات الكبيرة: الحجم» والسرعة: والتنوع 
والشمول» والدقة / الفهرسة» والعلائقية: والمرونة / قابلية التوسع التي تميزها عن البيانات 
الصغيرة (انظر الجدول .)١-۲‏ 


فهذه هي دورة ال مستوى الأول فيما يتعلق بتقديم تقييم توصيفي لطبيعة البيانات 
الكبيرة. وهناك حاجة إلى مزيد من العمل لتقييم البيانات الكبيرة الناتجة عن مصادر 
متعددة لتحديد ما إذا كان هناك أصناف متنوعة في طبيعة البيانات الكبيرة. فعلى سبيل 
المثالء قد تحمل بعض البيانات خمسا أورستا من هذه الخصائص. .ولكنها لا تشكتوفي أو 
ضعيفة في واحدة أو اثنتين» وقد تفتقر مجموعة بيانات إلى التنوع (منظمة بشكل GS‏ أو 
الحجم (صغيرة» ولكن شاملة مع حجم العينة ن = الجميع). أو قليلة السرعة gi)‏ إنشاء 
البيانات بانتظام ولكن في كل شهر عوضا أن تكون بشكل مستمر)» أو تفتقر إلى الفهرسة 
(كونها مجهولة ا مصدر أو مجمعة)» مع حملها للخصائص الأخرى على سبيل المثال. فمن 
الواضح أن مثل هذه البيانات ليست بيانات صغيرة كما هو مبين ف الفصل الثاني» ولكنها 
في ذات الوقت ليست بيانات كبيرة كما تفهم بمعناها الضيق الذي يصفها بكل الخصائص 
السبع» ولكن يمكن اعتبارها على الرغم من ذلك شكلا من أشكل البيانات الكبيرة. وبعبارة 
أخرىء هناك حاجة لإنتاج تصنيف للبيانات الكبيرة قائم على أدلة تجريبية قوية مع أمثلة 
الحالات التي من شأنها أن تساعدنا على التفكير بصورة أكبر في طبيعة هذه البيانات. 
ويحتاج هذا إلى أن يكون مصحوبا بدراسة للخصائص الأخرىء مثل نوعية البيانات وصحتها 
ودقتهاء ومنشئها (انظر الفصل التاسع). 


ع ١‏ ثورة البيانات البيانات الكبيرة» والبيانات ال مفتوحة:. والبنى التحتية للبيانات» والنتائج المترتبة عنها 


7 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 





السانات الكبيرة 


كما تثير الخصائص السبع للبيانات الكبيرة تساؤلات بشأن الآثار المترتبة على طوفان 
مثل هذه البيانات: وما الذي يعنيه القدرة على الوصول إلى بيانات كبيرة جداء وشاملة 
ومتغيرة» ودقيقة. ومفهرسة» deging‏ وعلائقية: 45,25( وقابلة للتوسع بالنسبة للمجتمع 
والحكومة ورجال الأعمال؟ وإلى أي مدى يمكن أن توفر هذه البيانات رؤى ثاقبة عن 
حالة الإنسان أو المساعدة على تناول بعض القضايا الاجتماعية, والسياسية» والاقتصادية: 
والبيئية الأكثر إلحاحا والتى تواجه كوكب الأرض؟ أوء بدلا من خدمة الصالح «elsi‏ فهل 
ستستخدم هذه البيانات لمزيد من خدمة المصالح الخاصة ف الغالب؟ أو خدمة مصالح 
الدولة؟ وكيف سوف تغير هذه البيانات في نظرية المعرفة العلمية في جميع المجالات 
(الآداب والعلوم الإنسانية: والعلوم الاجتماعية» والعلوم الفيزيائية والحياتيةء والهندسة)؟ 
فالفصل السابع والثامن والعاشر ستناقش هذه القضايا بالتفصيل» وتقدم التفكير النقدي 
لآثار وعواقب البيانات الكبيرة. 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها £o‏ 
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ممكنات السانات الكسيرة ومصادرها 


برز النمو السريع للبيانات الكبيرة نتيجة التطور المتزامن معه لعدد من التقنيات ae all‏ 
والبنى التحتية» والأساليب «Loy ls‏ وتضمينها بشكل سريع ف الأعمال اليومية: وا ممارسات» 
والمساحات الاجتماعية. وتضمنت هذه البنية التحتية المعرفية الجديدة إطلاق طيف واسع 
من de garo‏ متنوعة من CU‏ معلومات والاتصالات. وخاصة dass‏ الإنترنت الثابتة 
وامتنقلة عبر الهاتف المحمول؛ وإدخال البرمجيات في جميع الكائنات» والآلات والأنظمة: ناقلة 
Lali‏ من «الغباء» إلى «الذكاء». Was‏ عن إنشاء أجهزة وأنظمة رقمية بحتة بالكامل؛ وتطوير 
الحوسبة الشمولية الواسعة الانتشار والقدرة على الوصول إلى الشبكات والحوسبة في العديد 
من البيئاتء. وعلى ذات خطى هذا التحرك؛ التقدم في تصميم قواعد البيانات ونظم إدارة 
المعلومات؛ وعروض التخزين الموزع. والتخزين الأبدي للبيانات بأسعار معقولة؛ والأشكال 
الجديدة من تحليلات البيانات المصممة للتعامل مع وفرة البيانات بدلا من ندرتها. 

وإضافة إلى تمكين الوصول والمشاركة والتخزين للبيانات» تعد dadl‏ التحتية والمعرفية 
الجديدة في الغالب الوسيلة التي VI‏ إنتاج الكثير من البيانات الكييرة منها. ففي glg)‏ 
وبلا شك أن الحالة في وقتنا الحاضر تتمثل في أننا نعيش في مجتمعات تستخدم على نحو 
متزايد تقنيات البيانات المكثفة والمنتجة لها وتنتظم على أساسها. كما أصبحت ال ممارسات 
الشخصية ف الاتصالء والاستهلاك. والإنتاج والسفر. والحياة المنزلية: أكثر فأكثر تتوسّطها 
الأجهزة الرقمية التي تنتج الكثير من البيانات المستنفذة القيّمة. وعلاوة على «AUS‏ يتم 
الآن مراقبة وتنظيم الأماكن التي نعيش فيها على نحو متزايد بمجاميع كثيفة من التقنيات 
والبنى التحتية المدعمة بالبيانات» مثل أنظمة ال مرور وإدارة GLb‏ ونظم المراقبة والشرطة. 
وقواعد البيانات الحكومية: وإدارة العملاء وسلاسل الدعم اللوجستية: والأنظمة امالية 
ونظم المدفوعات. وستناقش العوامل المساعدة ومصادر البيانات الكبيرة بالتفصيل فى هذا 
الفصل. 


ثورة السانات السانات «a SJ!‏ والسانات | c> gåt‏ والبنى التحشة للسانات» والنتائج ا مترتة عنها /اع ١‏ 
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العوامل المساعدة للسانات الكسيرة: 

تعد البيانات الكبيرة مُحصلة للتطور والتقارب بين مجموعة متقدمة من التقنيات ف 
مجال الحوسبة منذ نهاية الحرب LLII‏ الثانية. ويشمل ذلك إنتاج أجهزة الحاسب 
امركزية في الخمسينيات والستينيات؛ وشبكات الإنترنت الوليدة في السبعينيات والثمانينيات 
التي ربطت الحاسبات بعضها ببعض؛ والانتشار الواسع النطاق للحاسبات الشخصية في 
الثمانينيات والتسعينيات؛ والنمو الهائل للإنترنت في التسعينيات» وتطوير الصناعات UJ!‏ 
على الويب» جنباً إلى جنب مع النمو الهائل في الهواتف النقالة والأجهزة الرقمية مثل أجهزة 
الألعاب والكاميرات الرقمية؛ وتطوير الحوسبة السحابيةء والموزعة:. والنقالة» وتقنيات 
الإصدار الثاني لشبكة الويب )2.0 (Web‏ في بدايات الألفية الثانية؛ وتفشي الحوسبة الشمولية 
واسعة الانتشار (Ubiquitous and Pervasive Computing)‏ خلال هذا العقد. وخلال 
هذه الفترة وقع اعدد من اممؤثزات التحويليةء فزادت القذرة الحاسونية أضعافاً مضاعفة 
وتم ربط الأجهزة da‏ وتداخلت الأنظمة الرقمية بازدياد متعاظم فى شئون الحياة اليومية 
وعملياتهاء وأصبحت البيانات أكثر من أي وقت مضى مفهرسة وقابلة للقراءة الآليةء كما 
توسعت أنظمة تخزين السيانات وأصحت موزعة. 


الحوسبة (Computation)‏ : 
بينما قدّمت الحواسيب الرقمية ال مركزية الأولية في الخمسينيات والستينيات قدرة 
حاسوبية أكثر كفاءة من تلك التي عند البشر والأجهزة التناظرية التي استخدموها (مثل 
cala sl‏ والآلات الحاسية ALAI‏ والآلات الحاسبة بالبطاقات المثقوبةء وأجهزة 
الحاسب التناظرية: إلخ)ء إلا أن قوة المعالجة لها كانت محدودة: ومن ثم كانت أنواع 
العمليات التي يمكن أداؤها مقيدةء وعلاوة على ذلك كانت تلك الحواسيب كبيرة الحجم 
ومكلفة. على سبل «JULI‏ كان بإمكان حاسب Electronic Numerical) JL SV‏ 
(Integrator Analyser and Computer- ENIAC‏ الذي E E‏ منتصف الأربعينيات: 
أداء خمسة آلاف عملية gar‏ وطرح 3( التانيةء ولكن اقتصرت ذاكرته الرئيسية عالية 
السرعه على عشرين كلمة (أي قمانين UY (cob‏ تزن ثلاثين طنا وتحتوى ۱۸,۰۰۰ 
أننون فراغيء. Y6,* tg‏ مرخل» ومتات الآلاف من المقاومات وا مكثفات والمحاثات. 
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ويامب دام مائتى كيلوواط من الطاقة الكهربائية )2004 .(Najmi‏ وق العام «e YA10‏ 
توقع Gordon Moore‏ من إنتل Ob‏ يتضاعف عدد الترانزستورات ف الدوائر المتكاملة 
كل ثمانية عشر شهرا في العقد المقبل ذلك الحين. مما يزيد بشكل كبير القدرة الحاسوبية 
(وهو ما أصبح يعرف لاحقا باسم قانون مور). وقد أشنت هذا التوقع بصيرة Ca 633b‏ 
تم إدخال تحسينات تقنية على مكونات وتصميم أجهزة الحاسب (من خلال الانتقال 
من الأنابيب الفراغية إلى الترانزستورات إلى الدوائر المتكاملة إلى ا معالجات المصغرة): 
سوا القوة الحسابية فيما يقرب من الخمسين stus GUIS‏ بين ١15٠ (uale‏ م 
۰م )2002 dlg .)NNordhaus‏ جانب هذا النموء انخفضت تكلفتها بشكل uS‏ 
in‏ تشير إحدى التقديرات بانخفاض ف تكلفة الحساب ناهز أضعاف الكوادريليون 
(Yes )‏ خلال القرن العشرين )2003 (CRA‏ 
استمرت مثل هذه الزيادات الهائلة في القدرة الحاسوبية والانخفاضات الكبيرة في 
التكلفة في الألفية الجديدة؛ ولكن الأهم من ذلك أنها أصبحت متنقلة على نطاق واسع 
مع انتشار مكثف للأجهزة الحاسوبية المحمولة مثل أجهزة الحاسب ال محمولء والأجهزة 
اللوحية والهواتف ASUI‏ وأجهزة الملاحة ال مرتبطة بالأقمار الصناعية (SatNav)‏ وغيرها. 
وتعادل قوة المعالجة للهاتف الذي المتوسط "عشرة أضعاف قوة جهاز الحاسب ال مركزي 
كراي1- (Cray-1)‏ الذي تم تشغيله في مختيرات لوس الاموس الوطنية في عام 1976م " 
(Townsend 2013: xiii)‏ مع استخدامها جزء من قوة معالجتها. حيث تمتلك قدرات 
حاسوبية» وتخزينية» وتطبيقات أكثر من العديد من أجهزة الحاسب الشخصية منذ 
عقد واحد فقط من الزمن» وهي Jass Lau]‏ جزء بسيط ق حجم العتاد المستخدم. 
e‏ سل JELI‏ لدى العديد من الهواتف الذكية معالجا مصغرا Y, - M0 de gus‏ 
غيغاهرتز و5١‏ - Coblas YY‏ من الذاكرة الرئيسية. Een‏ هذه القوة في امعالجة 
وسعة الذاكرة من معالجة كميات كبيرة lae‏ من البيانات بسرعة. eJ‏ تخزينها TA TNR‏ 
لأنها متصلة Lå‏ ومشتركة. 
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الربط (Networking)‏ : 
بذات القدر من الأهمية للنمو الكبير في القوة الحسابية لمعالجة البيانات الرقمية كان 
الربط بين الحاسبات بعضها مع بعض والذي سهل نقل وتبادل البيانات فيما بينها. وقد 
وقع أول اتصال شبكي بين جهازي حاسب عبر شبكة الإنترنت في نوفمبر عام «e VAM‏ وقد تم 
الربط بين نقطة في جامعة كاليفورنيا في لوس أنجيلوس (UCLA)‏ ونقطة أخرى في جامعة 
ستانفورد )1995 (Salus‏ ثم نمت الشبكة ببطء» من ١١‏ نقطة فى يناير ١/ا19م:‏ إلى YY‏ في 
أبريل ۱۹۷۲م إلى Y‏ في يونيو «e AVE‏ و۱۱۱ بحلول مارس e AVV‏ واقتصرت حينها على 
متعاقدي JEg‏ مشاريع البحوث المتطورة الدفاعية ARPA) (Hart et al. 1992; O Neill)‏ 
1995(. وتعمل شبكة الإنترنت من خلال تقطيع البيانات والتعليمات في حزم متساوية 
الحجم ونشرها عبر lhal‏ مع عنونة كل حزمة بمعرّف وعنوان المرسل إليه المطلوب» ثم 
تمرّر كل حزمة من نقطة اتصال إلى أخرى إلى أن La‏ إلى الوجهة المقصودة حيث يتم إعادة 
تجميعها هناك. ولتمكين اتضال الأجهزة والشبكات التي تعمل على سرعات مختلفة على 
مدار الساعة وتستخدم loo‏ مختلفة الحجم؛ اعتمدت مجموعة معيار (بروتوكول) الشبكة 
تي سي à‏ / آي بي (TCP/IP)‏ (معيار التحكم بالإرسال / بروتوكول الإنترنت) في عام ۱۹۷۳ 
(O'Neill 1995)‏ ولا يزال هذا المعيار يستخدم حتى يومنا هذا. كما يؤكد هذا ال معيار على 
حيادية الشبكة» حيث يتم التعامل مع كافة البيانات على قدم المساواة ودون تمييز بينها أو 

(Wu 2011) ف التكلفة‎ Lòla 
وبحلول أواخر السبعينيات» تم إنشاء الشبكات المحلية الداخلية: كما تم إنشاء الشبكات‎ 
الأخرى دوليا وتمّ ربطها بشبكة الإنترنت الوليدةء إضافة إلى شبكات الهواة المستقلين‎ 
والشركات» كما أصبح من الممكن إرسال حزم البيانات عبر الأقمار الصناعية. وبالإضافة إلى‎ 
(Kitchin 1998) نقل البيانات والملفات: تم إنشاء البريد الإلكتروني واللوحات الإعلانية‎ 
وخلال الثمانينيات» نمت البنية التحتيةء مع لاعبين جدد من المؤسسات والشركات» جنبا إلى‎ 
جنب مع تطور شبكات الإنترانت الداخلية (الشبكات الخاصة). وف عام ۱۹۹۲م اخترع تيم‎ 
في جنيف الشبكة العاطية (الويب)ء‎ (CERN) من سيرن‎ (Tim Berners-Lee) بيرنرز لي‎ 
وقدّم وسيلة سهلة الاستعمال أكثر بكثير للوصول إلى الإنترنت واستخدامها. وخلال‎ 


10۰ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 





AA 


المكتبة الاقتصادية 
ölið‏ المكتبة على التبليجرام  ECONLIBRARY‏ © 


ممكنات السانات الكييرة ومصادرها 


التسعينيات وبدايات الألفية الجديدة: تم تطوير تقنيات شبكية جديدة مثل شبكات اتصال 
اميدان القريب (NFC)‏ والتواصل اطباشر (Proximate Communication)‏ باستخدام 
معابير البلوتوث» والتغطية المحلية اللاسلكية الواي فاي (WiFi)‏ والشبكات الوطنية 
للاتصالات (GSM/3G) a là!‏ وَوَفقا لقوانين جورج غيلدر )2000( (George Gilde)‏ 
في الاتصالات» فإن إمدادات العام من عرض النطاق الترددي (قدرتها على نقل البيانات) 
تتضاعف كل سحة اهن > مع مزيد من القدرة الإضافية التى تقدمها الشكات اللاسلكية. 
doug‏ لهذه التطورات؛ 488 أصبح h» l‏ متاحا بين الأجهزة الحاسوبية من خلال شبكة 
الإنترنت بشكل أسهل على نحو متزايد» وأسرع وعلى نطاق أوسع. 


الحوسبة الشمولية واسعة الانتشار: 

صاحب التوسع ف النفاذية وقدرة الوصول إلى شبكات تقنية المعلومات والاتصالات 
وزيادة سعات قنوات الاتصال (عرض النطاق الترددي)ء تنوع وتوسّع ف الأجهزة الرقمية 
والتي تتصل إما بشكل مباشر أو غير مباشر (حيث يتم تحميلها على جهاز آخر (Yal‏ 
بشبكة الإنترنت لتبادل البيانات» أو التعليمات» أو الحصول على التحديثات اللرمجية. 
ففي بعض الحالات» حلت التقنيات الرقمية الجديدة محل الأشكال السابقة من البيانات 
التماثلية / التناظرية: فعلى سبيل «JULI‏ تم استبدال أنظمة الهاتف التماثلي بالهواتف 
المحمولة والهواتف ASII‏ واستبدلت كاميرات المراقبة التناظرية التي تسجّل على شريط 
فيديو بكاميرات رقمية تلتقط الصور الرقمية» ويجري الاستعاضة عن الموسيقا المخزنة 
على الشريط المغناطيسي أو الفينيل بملفات صوتية رقميةء والنماذج الورقية بأخرى 
إلكترونية على الإنترنت. من هناء تم تحويل الأجهزة والأنظمة التي كانت تعد نسسا 
«غبية» لتصبح «ذكية» ببعض الطرقء وعادة من خلال استخدام البرامج ال مرتبطة بها 
(Dodge and Kitchin 2005)‏ وتعني كلمة «الذكية» هنا بشكل .عام بن الجهاز قد 
نمت برمجته ليكون elg‏ للطريقة الخاصة التي يستخدم بها habs‏ على اتخاذ قرارات 
مستقلة. «dolo‏ ومؤتمتة من مجموعة الخيارات المحددة من خلال تطبيق خوارزميات 
على البيانات المنتحة (انظر 20072 .(Dodge and Kitchin‏ وخر مثال على تجميع 
تقني «غبي» أصبح على نحو متزايد «ذي» هو السيارةء فالسيارة الحديثة يتم تحميلها 
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بأجهزة رقمية» ومستشعرات ومحركات» والتي تراقب وتنظم أنظمتها المختلفة وتتداخل 
مع تجربة القيادة )2004 (Thrift‏ ويممكن أن تنتقل البيانات المخزنة من هذه الأجهزة 
عبر شبكات الاتصالات عن بعد للشركات أو تحميلها من قبل مهندس لإجراء تحليل 
تشخيصي (Dodge and Kitchin 2007a)‏ وق حالات أخرىء هناك أجهزة لا مكافئ 
تناظريا cu duy‏ تنتج بيانات جديدة UIS‏ في WS‏ مثل تلك الناتجة عن أنواع جديدة 
من التقنيات الرقمية» والمسح الضوقء وأجهزة الاستشعار على سبيل JELI‏ ماسحات 
التصوير بالرنين المغناطيسي MRI‏ في مجال الصحةء وإضافة إلى جعلها «ذكية» فإن 
الأنظمة تعمل في الغالب على جمع أكبر قدر من البيانات قدر الإمكان» وتسعي لتكون 
هذه البيانات شاملة وليست انتقائية. وهناء قد يتم جمع Ollo‏ عرضية أو غير ضرورية 
لتوفير الخدمة أو العملية. مثل التفاصيل الشخصية أو الموقع الجغرافي. فغالبا ما تُحدد 
الإعدادات الافتراضية للأجهزة بشكل يتيح للناس إمكانية اختيار الانسحاب من أنظمة 
إنتاج البيانات من خلال عقود الاستخدام للبرمجيات والمواقع: مع yal‏ على العقوبات إذا 
اختاروا القيام بذلك» مثل تردى الخدمات» والتكاليف الإضافيةء أو حجب الخدمة بالكلية. 

وبا لمثلء. حصل هذا النمو ف الأجهزة الرقمية في «Jl‏ وف الشارع. وف أماكن العمل 
وعبر شبكات النقلء وفي غيرهاء مما دفع المعلقين للافتراض بأننا قد ولجنا عصر (البرمجيات 
في كل مكان -2006 .(EveryWare) (Greenfield‏ !53« هذا هو pas‏ الحوسبة واسعة 
الانتشار في كل مكان» حيث يتم توزيع القدرة الحاسوبية وإتاحتها في كل OGK‏ مع العديد 
من الأجهزة الحاسوبية التي تعمل لكل شخص )2012 (Lucas et al.‏ فالحوسبة امنتشرة 
(Pervasive Computing)‏ هي إضافة للقدرة الحاسوبية وإتاحة الوصول إلى شبكات 
تكنولوجبا المعلومات والاتصالات للكائنات والبيئات البومية الثابتة لجعلها تفاعلية و«ذكية» 
.(Dourish 2001)‏ وف Lll‏ فإن الحوسبة $( كل مكان (Ubiquitous Computing)‏ 
هي القدرة الحاسوبية التي تتحرك مع الشخص بغض النظر عن البيئة؛ كالأجهزة التي 
يحملها الناس مثل الهواتف الذكية وأجهزة الملاحة عبر الأقمار الصناعية التي تعتمد على 
الوصول إلى شبكات duis‏ ال معلومات والاتصالات لتقديم الخدمات. وإذا كان شعار الحوسبة 
امنتشرة هو الحوسبة «في كل شيء» فإن شعار الحوسبة في كل مكان هو الحوسبة «في كل 
مكان»» مع إبراز الحوسبه المنتشرة لعمليات التباعد والتفرع (تضمين البرمجيات في مزيد من 
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الأجهزة) وإظهار الحوسبة في كل مكان لأوجه التقارب (جهاز رقمي واحد للقيام مزيد من 
امهام) )2011 .(Kitchin and Dodge‏ وبينما يلزم الحوسبة منتشرة أن تكون على إدراك 
موقعي/موضعي (Situationally Aware)‏ لتنفيذها elan‏ تتطلب الحوسبة في كل مكان 
الإدراك امستمر للسياق واطوقع. 

:(Indexicaland Machine-Readable Identification) àJ Vl قابلية الفهرسة والقراءة‎ 


على مدى نصف القرن الماضي» أصبحت الظواهر في العام أكثر وأكثر تحديدا بشكل 
فريد ومن السهوله التقاطها كبيانات» بسبب التقنيات الرقمية وتقنيات العنونه ووضع 
العلامات الجديدة. مما زاد في درجة دقتها وعلائقيتها ومن ثم مستوى التفصيل ف تحليلهاء 
بالإضافة إلى تمكين ربط مجموعات بيانات أكثر (انظر الفصل الرابع). فعلى سبيل «JULI‏ 
تتميّز كل الأجهزة الرقمية التي تساهم في الحوسبة المنتشرة والحوسبة في كل مكان بمعرّف 
فريد مُفهُرس» بحيث Oso‏ رمز تعريف حصري لکل منها مما یتح رصدها وتتبّعها على 
الدوام. وعلاوة على ذلك» فإن جميع عناصر إنترنت الأشياء (Internet of Things- IoT)‏ 
كوكبة واسعة من الأجهزة المتصلة بالشبكة: المحركاتء وأجهزة الاستشعارء تنتج Ollo‏ 
مفهرسة مكن lazu?‏ بشكل فريد )2004 .(Gershenfeld et al.‏ وإضافة U‏ فإن 
امعرفات الفريدة التي تم ربطها بالناس منذ زمن طويل» مثل جوازات السفرء والبطاقات 
الصحية. وسجلات التأمينات الاجتماعيةء قد جرى تعزيزها من خلال أنظمة تحديد الهوية 
الرقمية والحيوية الجديدة التي تربطها بقواعد بيانات ;4453 تتحقق من هويتهم Dodge)‏ 
.(and Kitchin 2005‏ وهذه تشمل أسماء ا مستخدمين وكلمات JI‏ « وبطاقات السحب 
ا مغناطيسية: والقارئات الرقمية لبصمة الأصابع» وقزحية العينء والحمض النووي. às‏ كل 
حالةء تعد هذه المعرفات بمثابة المصافحة الرقمية» على الرغم من أنها تختلف في مستواها 
من حيث الدقة والثقة. فعلى سسل «JULI‏ مكن لأسماء المستخدمين وكلمات ال مرور أن 
تسرق أو 5353 بسهولة؛ في حين أن الحمض النووي هو أصيل وفريد لكل شخص ويحقق 
امعايير الأربعة الأولى من قانئمة كلارك (Clarke 1994b)‏ المتعلقة بالخصائص ال مرغوب 
فيها لتحديد هوية الكائن البشري بشكل فعال وهي: شمولية التغطية / النطاق (يجب 
أن يمتلك الجميع الخاصية نفسها)؛ التفرّد (يجب أن متلك كل شخص قيمة واحدة فقط 
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لهذه الخاصية: ولا يتساوى فيها آي شخصين)؛ الدوام (يجب أن لا تتغير قيمة الخاصية 
مرور الزمن» ولا تكون قابلة للتغيير أيضا)؛ اللزوم (بمعنى أن تعد الخاصية dio‏ طبيعية 
لا مكن إزالتها ولا غنى عنها). وهذه الصفات تتوافق مع الصفات السبع الأخرى وهي: 
القدرة على التحصيل/ الجمع؛ والقدرة على التخزين؛ والتفرد؛ والدقة؛ والبساطة؛ والتكلفة 
والتناسس؛ والقيول. 

وبا لمثلء فإن رموز التحديد المكانية هي أنظمة تحذد مواقع الأشخاص. والأماكنء 
والكائنات في جميع أنحاء العام» وتشمل خطوط الطول والعرضء وإحداثيات الخرائط 
Lil‏ والوحدات الإدارية مثل الرموز .(Zip Codes) bwyl‏ وتختلف هذه الأنظمة 
في نطاقها ودقتها (درجة التفصيل)ء وقد أصبحت أكثر دقة وتحديدا من أي وقت مضي. 
فعلى سبيل JEL‏ توس البيانات الإدارية بالنسبة إلى الملكيات الفردية أو قطع الأراضي بدلا 
من الآحباء؛ كما Joao‏ أى جهاز يحوي نظام تحديد امواقع العامي Global Positioning)‏ 
(System- GPS‏ الموقع في نطاق بضعة أمتار؛ وبدأت أنظمة الخرائط الوطنية بإسناد عدد 
كبير من الكائنات الناشئة بفعل بشري أو طبيعي في المخططات الخرائطية بمعرفات إقليمية 
فريدة. ويوجد معرفات فريدة أخرى شائعة على نحو متزايد للمنتجات (انظر الفصل 
(9l JI‏ والمعاملات (على سبيل (JULI‏ طلبات الشراء)ء والتفاعلات (Ae)‏ سبيل «JULI‏ البريد 
الإلكتروني والمكالمات الهاتفية). 

وفضلا عن كونها أكثر قابلية للفهرسة والتبويب» أصبحت رموز تحديد الهوية قابلة 
للقراءة WT JYI‏ على نحو متزايد )2005 .(Dodge and Kitchin‏ على سل JELI‏ 
يحتوي 5a Jl‏ الشريطي (Barcode)‏ على رمز تعريف يرتبط بنظام معلومات يحتفظ ببيانات 
وصفية إضافيه تصف الكائن عند مسحه بقارئ ليزري (مثل نوع المنتج / النموذجء تاريخ 
ومكان الصنع» الأسعارء وما إلى ذلك). كما يمكن استشعار رقائق تحديد الهوية باستخدام 
موجات الراديو (RFID)‏ عن بعد من قبل مستجيب راديوي والتعرف عليها. ويمكن 
كذلك التعرف على المركبات بواسطة برنامج التعرف JI‏ على أرقام لوحاتهاء وقد تم 
تطوير تقنيات خوارزمية جديدة للتعرف وتحديد هوية الوجوه وطريقة الطشي (كيف مشي 
الناس). وهكذا أصبحت عناص ر/ كائنات العام مفتوحة لجمع والتقاط بياناتها وتحديد 
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هويتها تلقائياء مما gags‏ بشكل كبير نطاق البيانات المنتجة ومدى دقتها بالنسبة إلى نظام 
ماء مما قدم أشكلا جديدة من التنظيم والحوكمة (Dodge and Kitchin 2007a)‏ وعزز 
عمل الأنظمة بطرق أكثر آلبة )2011 .(Kitchin and Dodge‏ لذا فإن الاتجاه السائد هو 
امزيد وامزيد من التحديد للظواهر وا ممارسات لتصبح معرّفة بشكل فريد وقابلة للقراءة 
«LU‏ مما يزيد الدقةء والعلائقيةء والأتمتة. 


تخزين السانات :(Data Storage)‏ 
كان هناك تحول كبير. على مدى العقدين الماضيينء في القدرة على التخزين الطويل 
الأمد لكميات هائلة من البيانات» ففي البداية تم تخزين البيانات الرقمية في صورة تناظرية 
باستخدام البطاقات المثقوبة وذلك قبل أن يتم الانتقال إلى الشريط ا مغناطيسي والأقراص 
الصلبة. وقد استكملت هذه الوسائل باستخدام وسائط التخزين الرقمية المتنقلة والتى 
تعرف باسم الأقراص المرنة (Floppy Disks)‏ وتلا ذلك ظهور الأقراص المدمجة (CDs)‏ 
وأقراص الفيديو الرقمية (DVDs)‏ ومحركات الأقراص الخارجية والذاكرة المتنقلة Flash/)‏ 
.(External Drives‏ وقد دفعت تقنات الأقراص الصلبة (Hard-disk Technologies)‏ 
على وجه الخصوص. بالقدرة على تخزين البيانات الرقميه بشكل كبيرء وذلك مع gal‏ 
الكبير للسعة التخزينية المقدرة بالخانة الثنائيه لكل بوصة مربعة (بت/إنش2)» في حين 
انخفضت التكلفة لكل غيغابايت بشكل كبير وبعامل يقدر بعشرة ملايين إلى واحد من عام 
J! a 1956‏ 2000م )2000 (Gilheany‏ واستمرت الأسعار في الهبوطء مما جعل التخزين 
الرقمي أرخص تكلفة بكثير وأقل مساحة من الأشكال التناظرية (على سبيل JELI‏ الورق أو 
الأشرطة الفلمية) )2003 .(Grochowski and Halem‏ فالآن: أصحت التكاليف رخيصة 
جدا وبالشكل الذي يمكن من تخزين كميات هائلة من OLLI‏ بمقابل بخسء ودون 
الحاجة تقريباً لحذف الملفات القدهة. ونتيجة لذلكء فإن ا معاملات التي تجري اليوم de)‏ 
سبيل JELI‏ رسالة أرسلت إلى قائمة البريد الإلكتروني أو صفحة موقع التواصل الاجتماعي 
الفيسبوك» أو المدفوعات إلى متجر باستخدام بطاقة الائتمانء أو المحادثة مع أحد الأصدقاء 
على الهاتف) من الممكن تسجيلها وحفظها بشكل جيد إلى ما بعد وفاة الشخص امعني dy‏ 

مع إمكانية الإشارة إليها وتحليلها في أي وقت في المستقبل. 
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ونتيجة لذلك» وكما نوقش في الفصل السابقء كان النمو في حجم البيانات المخزنة 
بالأرقام المطلقة والنسبية Li al‏ وخاصة منذ العام2000م. فعلى سبيل ال مثالء قدّر 
Hilbert and López (2009)‏ أن خمسه وعشرين ق his 4 5U‏ من البيانات تم 
تخزينها في شكل رقمى في ele‏ 2000 مع الاحتفاظ ها تبقى بأشكال تناظرية مثل الكتب» 
والمجلات: والصورء والأشرطة الممغنطة. وبحلول عام 2007 «e‏ شكلت البيانات الرقمية ما 
نسبته أربع وتسعون ف المائة من مجموع البيانات المخزنة» ومنذ ذلك الحين تواصل gal‏ 
للحصة النسبية من البيانات edra I‏ خاصة مع تطور التخزين والخدمات ال موزعة من 
خلال الحوسبة السحابية ومراكز البيانات. وتأخذ الحوسبة السحابية أحد شكلين يعملان 
في الغالب بصورة تعاونية: سحب المرافق الخدمية (Utility Cloud)‏ وسحب البيانات 
التخزينية )2011 .(Data Clouds) (Farber et al.‏ فالسحب الخدمية توفر القدرات 
والإمكانات المتعلقة بتقنية المعلومات كخدمات حسب الطلب حيث مكن الوصول إليها 
عن dub iab‏ الزن كات و5[ الأشيكل مستفل ع موك الك Jiga‏ ذلك 
«البنية التحتية كخدمة» (Infrastructure as a Service- IaaS)‏ مثل التخزين والخوادم 
والشبكات» dahl»‏ كخدمة» (Platform as a Service- PaaS)‏ وتضم dto‏ التنفيذ 
لتطوير تطبيقات مخصصة وقواعد السيانات» و«الرمجيات كخدمة» Software as a)‏ 
(Sservice- SaaS‏ والتى OSE‏ ال مستخدمين من الوصول إلى التطبيقات ومعالجة البيانات 
عن Farber et al. 2011; Hancke et al. 2012) Aso‏ ). في حين Ke‏ سحب البيانات 
من ربط تخزينء ومعالجه كميات هائلة من البيانات التي قد تنتج عبر المؤسسة عن 
بعد. بالاعتماد على القدرة الحاسوبية لمئات من VI‏ 582 وتحليلها عن طريق سحب 
المرافق الخدمية )2011 (Farber et al.‏ ومن «e3‏ مكن للأفراد والشركات الاستفادة 
من التخزين والقدرة الحاسوبية دون الحاجة إلى القيام باستثمارات رأسمالية كبيرةء فضلا 
عن كونها قادرة على الاستفادة من هذه ال موارد من أى مكان يتوافر فيه اتصال بالإنترنت 
(Bryant et al. 2008)‏ 

Lbs‏ كان هناك تحول في LAS‏ تنسيق البيانات وهيكلتها عند 553 dpa‏ وبسبب 
الزيادة الناشتة 3 حجم» de wg‏ وتنوع البيانات» فقد عانت قواعد البيانات العلائقية 
للبقاء ومواجهة الموقف. فقد صمّمت لبيانات على درجة عالية من التنظيم: والسلامة 
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ولب والثابتة. وقد due‏ ظهر نكل was‏ من قواعد السانات هو قواعد السانات 

غير الهيكلية (NoSQL)‏ مما يتيج تخزين البيانات الكبيرة. وتميل قواعد البيانات غير 
JS aJ‏ & إلى أن تكون اقل ; تعقيدا تعقيدا في الشكل من قواعد البيانات العلائقية. ولكن مكنها 
التعامل مع كل من البيانات المنظمة (Structured Data)‏ وغير امنظمة Unstructured)‏ 
(Data‏ وهي قابلة للتوسع de pus‏ ومكنها التعامل فعلا مع العديد من مجموعات 
بيانات سريعة التغير وهائلة في الحجم jës‏ بالمروتة ف كيفية تنظيمهاء مما يتيج هياكل 
يانات مفصلة بحسب الطلب )2012 (Driscoll 2012; Marz and Warren‏ كما 
Jë‏ قواعد البيانات غير الهيكلية إلى تخزين البيانات الابتدائية الخام بدلا من ا ملشتقهة 
التي يتم هيكلتها وفقا لعلاقة مجديؤة .(Driscoll 2012) làL‏ فعلى JUL Law‏ .09 
قواعد البيانات غير الهيكليهة معلومات خام عن زيارة صفحة الويب (المشاهدة) بدلا 
من تخزين تعداد clas Zl‏ للصفحات المشتقة منهاء وهي اإستراتيجية أكثر قوة من 
حيث أنها تقلل من الأخظاء المحتملة في قواعد البيانات» ولكن هذه الإستراتيجية لا مكن 
تطبيقها مع قواعد البيانات العلائقية بسبب النمو السريع والحجم الناتج من ذلك النمو 
والذي لا مكن التعامل معه من خلالها )2012 .(Marz and Warren‏ ويتم في العادة 
توزيع البيانات وتكرارها عبر العديد من الأجهزة في قواعد البيانات غير الهيكلية بدلا من 
مركزيتها في مكان واحد (ومن ثم حل مشكله معا البيانات الكبيرة جدا كونها كبيرة 
جدا عن أن يجري احتواؤها على جهاز واحد)» > وتقسَّم طلبات الاستعلام ويجري تنفيذها في 
الوقت نفسه على عدد من الأجهزة جنبا إلى جنب ثم يُعاد تجميع النتائج (ومن ثم تسريع 
bl-a‏ الحسابية) )2012 .(Dumbill‏ وتتلخص هذه اللإستراتيجية من خلال 435 
التعيين والاختزال (ReduceMap)‏ التي تم تطويرها من قبل شركة جوجل حيث يتم تعيين 
البيانات والاستعلامات على عدة خادمات ومن ثم جمع النتائج الجزئية واختزالها معا 
.(Dumbill 2012)‏ ويعد هادوب (Hadoop)‏ الذي تم وضعه بداية من قبل شركة ياهو 
(Yahoo)‏ مثالا على قواعد البيانات غير الهيكلية ومفتوحة المصدر وشائعة الاستخدام في 
تطبيق نموذج التعيين والاختزال. فالحل البديل Jib‏ هذا النهج يتمثل باستخدام نموذج 
أكثر محدودية للبيانات» ودرجة أقل من العلائقية في مجموعة البيانات» وقدرة أقل على 
الاستكشاف باستخدام لغة الاستعلام العلائقة )2012 .(SQL) (Driscoll‏ وهذا يعني 5l‏ 
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قواعد البيانات غير الهيكلية مثالية للتخزين JERAI‏ والاسترجاع السريع لكميات هائلة من 
الساناتء ولكنها أقل فائدة لفحص العلاقات بين عناص البيانات (مركز تحالف البيانات 
امفتوحة 2012 Open Data Center Alliance‏ 


: (Sources of Big Data) مصادر السانات الكسرة‎ 

وفر التوسع الجذري والتكامل بين الحوسبةء والشبكات» والأجهزة «a8 JI‏ 323539 
البيانات منصة قوية لانطلاقة البيانات الكبيرةء وإضافة لذلك الوسيلة التي يتم بها إنتاج: 
ومعالجة. ومشاركة: وتحليل البيانات الكبيرة. ويمكن تصنيف هذا الإنتاج للبيانات في ثلاث 
فئات رئيسية. البيانات الموجهة (Directed Data)‏ والتي يتم إنتاجها بوسائل مراقبة 
تقليدية. حيث تتركز أنظار التقنية على شخص أو مكان من قبل Jéis‏ بشري. أما في حالة 
السانات الآلية (Automated Data)‏ فتنتج البيانات عن وظيفة كامنة في الجهاز al‏ النظام 
بطريقة ASE‏ في حين يتم تداول البيانات الطوعية (Volunteered Data)‏ وإهداؤها من 
قبل الناس للنظام. 


السانات الموجهة :(Directed Data)‏ 
توجد امراقبة المنظمة والهيكلية حيثما وجدت مجموعة من الناس الذين يشرفون 
على أشخاص آخرين كالمسؤولين عن إنفاذ القانونء وا معلمين» والأطباءء ومسؤولي الرعاية 
الاجتماعية: والبيروقراطيينء ورؤساء العمل والذين يعملون على مراقبة الآخرين شخصيا 
كامواطنينء والتلاميذ. والمرضىء والعمال أو من خلال العدسات التقنية كالمسوح Jio‏ التعداد 
JI‏ 35« ونماذج البيانات الحكومية: وإيصالات الضرائب» وعمليات التفتيشء وكاميرات 
مراقة الدوائر التلفزيونية ا ملغلقة (CCTV)‏ حيث e‏ كانت اطراقة الطنظمة والصكلية 
مكل T‏ طويلة loue Sa daa‏ لتساك ASS AS ATR PETA MEE Pa asas‏ 
الشركات )2007 .(Lyon‏ فهذا النموذج للتحكم (التداخل منطقي» الأدوات» المؤسسات› 
وأدوار وإجراءات الحوكمة) يتيح مركزية التنظيم والتحكم عبر مجموعة واسعة من 
ا مجالات» ويساعد ف الحفاظ على النظام» وإنتاج حكومة جيدة: وإدارة فعّالة وعمل à y^‏ 
ومجتمعات مستدامة ومستقرةء من خلال المحاسبة الفعالة للأشخاص والتهذيب GII‏ 
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أيضا (معنى» تعديل الناس سلوكهم ليتوافق مع التوقعات والقواعد). وتستكمل هذه 
النظم بطرق تحديد هوية الأفراد. مثل بصمات الأصابع» والصورء وأرقام التأمين الوطني أو 
الضمان الاجتماعى» وجوازات السفر ورخص SLI‏ التي تجعل من السهل تتبع واقتفاء 
آثر الناس» كما تم توسيع نطاق المراقبة ليشمل الحيوانات والبيئات» واستخدام الكائنات 
وحركتها. 

وحتى وقت قريبء كانت كل عمليات امراقبة جزئيه وتناظرية بطبيعتها وتنتج 
مستويات مختلفة من السانات lea «Alo ul‏ من الملاحظات غير المسجلة إلى السجلات 
التفصيلية أو التسجيل المستمرء ويجري تطبيقها أحيانا على عينات وفي حالات قليلة على 
المجتمع بأكمله. وكانت البيانات المسجّلة انتقائيةء تجمع من خلال التقارير أو الإبلاغ 
UI‏ على الورق أو على شريط مغناطيسي أو فيلم؛ في مكان وزمان معيّنين. وتميل البيانات 
إلى أن تكون منظمة للغاية في طبيعتهاء ومقتصرة على مجموعة من حقول البيانات المحددة 
مسبقا. وكانت السجلات ضخمة ومكلفة في التخزين: مما يعني عدم الاحتفاظ الطويل 
الأمد بها إلا لكمية محدودة من البيانات» إضافة إلى كون الكثير منها إما عبارة عن عينة 
أو مشتقة. وحتى في الحالات التي قد تكون المراقبة فيها مستمرةء مثل الدوائر التلفزيونية 
المغلقة. فقد تمتد اللقطات نفسها على فترات زمنية طويلة تتعدى قدرة الشريط التسجيلي 
على تغطيتها ويجري في العموم إعادة التسجيل عليها بعد فترة معينة (غالبا بعد سبعة 
أيام أو شهر). كما كان تحليل البيانات الناتجة من مختلف أشكال اءراقبة اللستخدمة 
يتم بواسطة مفسّر بشري إلا إذا جرى تحويلها رقميا في وقت لاحق. ds‏ حين أن كميات 
البيانات التي تنتجها هذه المراقبة يمكن أن تكون «dedu‏ وربما تستوفي واحدة أو اثنتين من 
الخصائص المرتبطة بالبيانات الكبيرة مثل قابلية الفهرسة والشمولية والعلائقية أو «Ae JI‏ 
إلا أنه لا (o Sae‏ حال أن تستوف مجموعة الصفات المرتبطة بالبيانات الكبيرة كاملة. 

وفي حين لا تزال العديد من أنظمة المراقبة والحوكمة مستمرة في كونها جزئية وتناظرية, 
كان هناك تحرّك في الآونة الأخيرة لاستبدالها والتوسع فيها بنظائر رقمية مكافئة لها والتى 
تنتج الآن بيانات كبيرة. فعلى سبيل «JULI‏ يجري استبدال أنظمة الدوائر التلفزيونية 
المغلقة التماثلية الثابتة بأخرى رقمية متحركة حيث Sue‏ تغيير مجال الرؤيةء والتقليل من 
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المحددات على التخزين» وتعزيز التفسير البشري بتحليلات خوارزمية dolua‏ مثل التعرف 
على الوجه أو طريقة ال مشيء كما يمكن ربط مثل هذه البيانات مع قواعد بيانات أخرى. 
وهناء يوجّه تركيز الكاميراء وعمليات التحليل والتفسيرء من قبل مشغل بشريء وبمساعدة 
من البرمجيات. على سبيل JULI‏ من ا ممكن مراقبة وضبط العديد من الكاميرات في 
غرفة عمليات الشرطة وربطها بسجل الحوادث الحية من أجل الاستجابة بكفاءة وتوجيه 
الموارد امناسبة مواقع معينة بشكل استباقي. وبالمثلء في مراقبة الهجرة والجوازات. حيث 
يجري آنيا جمع معلومات الركاب التفصيلية وتدقيقها مع مختلف قواعد البيانات الأمنية 
والحدودية بشكل الى أو (Real-Time) „hoJ‏ وإنتاج بيانات جديدة مثل ال مسح الضوني 
للصور الشخصية وبصمات الأصابع أو قزحية العين. وتستخدم العديد من الحكومات 
المحلية أنظمة da lo]‏ لتسجيل مشاركات المواطنين مع خدماتها آنيَا 9659 إن كان تعامل 
الموظفين مع أي قضايا قد تم ضمن أطر زمنية محددةء مع مراقبة مديري الإشراف للنظام 
لإعادة توجيه الموارد بحسب الحاجة. 

وتتكوّن بعض الأنواع الأخرى الأقل انتظاما ف إنتاج البيانات الكبيرة الموجهة من: 
التصوير الجوي الرقمي عن طريق الطائرات أو الطائرات بدون طيارء أو الفيديو المكانيء 
أو اللبدار (الرادار بتقنية الليزر) لكشف الضوء وتحديد مدى ias I‏ أو الحرارية أو غيرها 
من أنواع الأشعة الكهرومغناطيسية للبيئات التى تمكن من الرسم المتحرك للخرائط الثنائية 
والثلاثية الأبعاد للمناظر الطبيعية المفهرسة مكانيا بشكل آني أو لحظي (Real-Time)‏ من 
خلال نظام تحديد المواقع العالمي (GPS)‏ وتنتج Jis‏ هذه الفيديوهات والمسوح بالأشعة 
كميات هائلة من البيانات المتنوعة عالية السرعة. فعلى سبيل المثال» يمكن لماسح الليدار 
توليد مليون نقطة «dolo‏ مع دقة بيانية تصل إلى بضعة سنتيمترات» مع إمكانية إجراء أكثر 
من مسح خلال الثانية الواحدة. إن وضع ماسح ليدري في مركبة وقيادتها في الأنحاء أو 
الطيران به فوق منطقة معينة ينتج تمثيلا ثلائي الأبعاد Maio‏ للغاية للتضاريس الطبيعية 
لتلك المنطقة. 
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: (Automated Data) الآلية‎ LI 

ف حين وسّعت البيانات da Sl‏ أنظمة المراقبة والحوكمة التقليديةء فقد حول إنتاج 
البيانات الآلية بشكل جذري كيفية إنتاج البيانات وتوظيف استخداماتهاء ومكن من إنشاء 
أنظمة جديدة للتنظيم والإدارة التلقائية Dodge and Kitchin 2007a, Kitchin and)‏ 
‘Dodge 2011‏ انظر الفصل العاشر). فمن خلال مجموعة من التقنيات الرقمية يتم إنشاء 
البيانات تلقائيا بواسطة مجموعة من النظم الآلية وبرقابة بشرية قليلة. وعلاوة على 
ذلك» يتم ف الغالب معالجة وتحليل dis‏ هذه البيانات تلقائيا وبشكل مستقلء إذ يجري 
العمل عليها بواسطة خوارزميات برمجية لتحقيق نتيجة معينة تهدف إلى تنظيم ظاهرة 
ما. وهناك طرق عديدة لإنتاج البيانات الآلية»ء بعضها قد يكون إنتاجه ثانويا عن النظام 
وليس من صميم عمله. 


:(Automated Surveillance) &JV! المراقة‎ 

كما أصبحت تقنيات المراقبة رقمية بطبيعتها ومرتبطة بعضها «ass‏ فقد أصبح من 
ا ممكن lal‏ أعمتة جوانب متعددة لنظام المراقبة. وإضافة تقنيات جديدة. لتتبع أكثر فعالية 
وكفاءة في مراقبة وتتبع الاستخدام للأنظمة والأماكن المختلفة. وتعد قراءة العدادات 
الذكية مثالا على النموذج اليدوي من المراقبة التي غدت آلية بشكل متزايد. هناء يتم 
استخدام 4,135 قراءة العداد (Automatic Meter Reading- AMR) Ui‏ طراقبة استخدام 
JVI‏ 4 والتواصل معها دون الحاجة إلى القراءة البدوية التقليدية )2013 (Hancke et al.‏ 
وعلاوة على ذلكء يمكنها القيام بهذه المهام بشكل متواصل مما يمكن ال مورّد من تتبع 
الاستخدام بشكل آنی 9l‏ لحظيء وهذا له فائدة في مطابقة الطلب مع العرض وف العثور 
على أخطاء / تسريبات في النظام. كما أنها توفر وسيلة للقيام بالفوترة الآليةء مما Aou‏ من 
نفقات التوظيف. وف كثير من الحالات» من الممكن للمستهلك أيضا أن يراقب استهلاكه 
الخاص لخدمة duszo‏ مثل الكهرباء أو الغاز أو المياه. فعلى سبيل «JULI‏ مكن استخدام 
تطبيق للهاتف الذي للاتصال بعداد عن بعد باستخدام تقنية اتصال المجال القريب على 
سبيل JEL‏ البلوتوث: ومن ثم تغيير الاستهلاك تبعا لذلك. 
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وبا لمثلء 5555 أنظمة إدارة ال مرور من القدرة على تنظيم وضبط السائقين من خلال 
الاستفادة من duis‏ التعرف AMI‏ على أرقام لوحات Automatic Number Plate) SLS AI‏ 
.(Recognition- ANPR) (Dodge and Kitchin 2007a‏ فهناء تمسح الخوارزميات 
بيانات الصور من الكاميرات الرقمية للكشف عن لوحات الترخيص. ومن dam‏ يمكن 
استخدام هذه ال معلومات لتتبع ال مركبات خلال عبورها على طرقات ال مدينة وتقديم مدخلات 
إلى نظم النقل الذكية «(Intelligent Transportation Systems- ITS)‏ ومن جهة 552« 
مكن إحالة هذه البيانات إلى قاعدة بيانات مالي المركبات لإدارة الغرامات والعقوبات 
المتعلقة بالمخالفات المرورية. فعلى سبيل JELI‏ بالنسبة للمثال السابق» يتم فحص لوحة 
الترخيص لجميع المركبات الداخلة إلى منطقة الزحام ال مروري في لندن ومطابقتها مع قاعدة 
بيانات تلك المركبات التي سددّت رسوم الازدحام» أما تلك التي لم تسدّد خلال فترة أربع 
وعشرين ساعة فيتم تغريم مالكيها تلقائيا من خلال عملية الإدارة 4JVI‏ (يتمتع النظام 
باستقلالية في إصدار الغرامات دون الحاجة لرقابة بشرية). ويمكن للنظام ELL‏ استخدام 
كاميرات السرعة لإصدار قسائم تجاوز السرعة للسائقين المخالفين. 

وف حالات أخرىء تم تسهيل امراقبة الآلية من خلال استخدام رموز الهوية المقروءة 
LII‏ لتسجيل ماهية الأنشطة المريبة/ المجهولة على شبكة المراقبة. فعلى سبيل JEMI‏ ته 
استبدال التذاكر الورقية التي يتزايد تبادلها في السفر على نظام النقل من غير حامليها 
بالبطاقات الذكيه» التي ينبغي التدقيق عليها لدخول وخروج ال محطات ووسائل النقل. 
ويتم إنشاء daw‏ عند نقاط ال مسح ومن ثم يمكن تتبع كل حركات حاملى البطاقات الذكية. 
وق حاله نظام النقل ق لندنء فإن استخدام بطاقات أويستر (Oyster)‏ يعني أنه من 
الممكن تتبع الرحلات الفردية عبر نظام الحافلات والسكك الحديدية المستخدمة من قبل 
sala‏ راكب يوميا )2012 (Batty et al.‏ وبالمثلء من ال ممكن الآن المراقبة التلقائية 
لأشكال متنوعة من الخدمات العامة المقدمة التى كان يجري رصدها عرضاء مثل جمع 
النفايات» من خلال استخدام رقائق تحديد الهوية باستخدام موجات الراديو (RFID)‏ التى 
cus‏ على حاويات النفايات ويتم مسحها عن بعد عند نقاط الجمع. وأصبح من ال ممكن 
قياس كميات التخلص من النفايات باستخدام مقاييس dispo‏ بمجموعة مركبات وتحميل 
الأسر بصورة فردية تكلفة التخلص من النفايات على أساس الحجم بدلا من الرسم 35-9 
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دون „jatë‏ كما أضبح من الممكن أيضا الحصول على فهم مفصّل لأماط التخلص من 
النفايات داخل منطقة ما وإعادة تخطيط طرق وأوقات الجمع. 


:(Digital Devices) الرقمية‎ 8 542 VI 
كما سبق الإشارة 41« كان هناك نمو هائل ف عدد الأجهزة الرقمية ا مستخدمة حول‎ 
العام والتي تساعد على تسهيلء وتعزيزء وإدارة العديد من جوانب الحياة اليومية. فهذه‎ 
الأجهزة لا تقوم مجرد معالجة البيانات الرقمية والتعليمات فحسب» ولكنها تنتج بيانات‎ 
رقمية بشكل نشط وكوظيفة أساسية لها أو ثانوية» أو الاثنين على حد سواء. ومن الأمثلة على‎ 
الأجهزة التي تنتج بيانات رقمية كوظيفة أساسية: الكاميرات» وأشرطة الفيديوء والمراقيب‎ 
وأشكال مختلفة من المعدات الطبية مثل كاميرات المنظارء‎ (GPS) ووحدات تحديذ المواقع‎ 
أمثلة الأجهزة التي‎ Li وموازين الحرارة الرقمية: إلخ.‎ isgal والماسحات بالموجات فوق‎ 
رقمية كوظيفة ثانوية» فتشمل الهواتف النقالة ومستقبلات البث التلفزيوني‎ Ollo تنتج‎ 
Ae) عبر الكابل أو الأقمار الصناعية» والتي تنتج بيانات متعلقة بكيفية استخدامها‎ 
سبيل مثال» الوقتء المكان. الشخص المتصل / القناة المشاهدة). مع البيانات المتصلة‎ 
بها والتي جرى جمعها في سجلات يتم إرسالها إلى أطراف ثالثة (مثل مصنعي الأجهزة‎ 
ومقدمي الخدمات). أما الأمثلة على الأجهزة التي تنتج البيانات الأساسية والثانوية معا‎ 
فتشمل الهواتف الذكية التي يمكن استخدامها لتسجيل الملاحظاتء والتقاط الصورء وكتابة‎ 
البريد الإلكتروني والتعليقات على وسائل التواصل الاجتماعيء ...إلخ» بالإضافة إلى تسجيل‎ 
EE استخدام مختلف التطبيقات. وتشكل هذه الأجهزة سلالة جديدة من الكائنات:‎ 
کائنات ترصد وتتبع تاريخ‎ - (Logjects) (Kitchin and Dodge 2011( لوجكتس‎ 
استخدامها الخاص. وق كثير من الحالات» يكون من ال ممكن تسجيل موقع هذه الأجهزة.‎ 
فالهاتف الجوال والهواتف الذكية ممكن تتبّعها من الفضاء عن طريق التثليث (حساب‎ 
المثلثات) عبر هوائيات الهاتفء وأيضا عن طريق مستقبلات تحديد المواقع المدمجة فيهاء‎ 
ومقاييس التسارع‎ (Gyroscopes) بالإضافة إلى مراقبة السرعة والاتجاه من خلال امدوار‎ 
على شكل أقراص أسطواننية: أو أجهزة‎ (Compasses) والبوصلات‎ (Accelerometers) 
فإن العديد من هذه‎ US ملاحة بالأقمار الصناعية أو أي أجهزة أخرى. وعلاوة على‎ 
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الأجهزة يمكن أن تتفاعل بشكل مستقل بعضها مع بعض وتقوم بتبادل البيانات. ومع تكاثر 
الأجهزة المعقدة لكافة المهام وفي كل الأماكنء يتم إنتاج المزيد والمزيد من البيانات الغنية 
بالبيانات الوضفية القابلة للفهرسة:. مما يتيح تحليلا أكثر تظورا واستحداث إستراتيجيات 
ومنتجات جديدة قانئمة على الميانات. 


السانات المستشعرة :(Sensed Data)‏ 
تعد المستشعرات والمحركات من أنواع الأجهزة الرقمية. وهي ما يمكن أن تكون ضمنا 
أو جزءا من هياكل مختلفة لقياس مخرجات معينة مثل مستويات الضوء» والرطوبة» ودرجة 
الحرارةء والغاز والمواد ASLI‏ والمقاومة ASL al‏ والصوتىات» وضغط الهواء والحركة 
والسرعة. ...إلخ. وتعد أجهزة الاستشعار والمحركات صغيرة» وغير مكلفة في العموم: ويمكنها 
إنتاج تيار مستمر من البيانات» ويمكن أن تكون سلبية وتقرئ بواسطة الماسحات الضوئية: 
أو cd L23:O9$3 Ol Sce‏ حك تنك البيانات ue‏ ارات SE e doce‏ الحاسب 
ا لمحلية أو الواسعة: أو قد يكون لديها 8538 الاتصال من خلال حقل الاتصالات القريب 
(NFC)‏ والذي يتيح الاتصالات في اتجاهين )2013 .(Hancke et al.‏ وبوضعها على u>‏ 
مكن للمستشعرات أن تقيس وتتواصل لحساب معدلات التآكل (عن طريق قياس المقاومة 
الكهربائية) ومقدار الضغط على مواد البناء باستخدام أجهزة استشعار الانبعاثات الصوتية 
(للكشف عن انتشار ال موجات الصوتية) وأجهزة استشعار التخصّر ا مغناطيسي (للكشف عن 
تغيرات في الحث ال مغناطيسي). ومن ثم يقلل ذلك من الحاجة إلى التفتيش اليدوي ال مكلف 
.(Hancke et al. 2013)‏ وبا لمثلء مكن للمستشعرات داخل نظام امياه قياس نوعية 
ا مياه. وضغطهاء ومقدار تدفقهاء وتمكين الإدارة الآنية وصيانة الأنابيب لحظة بلحظة. deg‏ 
«US Ll‏ يمكن للمستشعرات رصد حجم العملء والإجهاد. والتضاريس. فشركة هيتاثي 
تستخدم هذه المجسات لرصد مركباتها الثقيلة المعقدة والمكلفة. وكذلك تفعل الشيء نفسه 
شركة النقل السريع (UPS)‏ مع أسطولها من عربات النقل والشاحنات بحيث توظفها 
لتشغيل خدماتها öh”‏ وبصورة استاقية Plumridge 2012; Mayer-Schonberger)‏ 
(and Cukier 2013‏ ومن خلال ربط رقائق تحديد الهويه باستخدام موجات الراديو 
(RFID)‏ بال منتجات أصبح من الممكن رصد وتتبع حركة الوحدات الفردية من المصنع 


Br‏ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 





AA 


المكتبة الاقتصادية 
ölið‏ المكتبة على التبليجرام  ECONLIBRARY‏ © 


ممكنات السانات الكييرة ومصادرها 


أو المزرعة إلى المستهلكء والحذ من السرقة والهدر. وبالمثلء» تحتوي بطاقة الضريبة على 
شريحة تحديد الهوية باستخدام موجات الراديو التي تتواصل مع قارئ ترددات راديوي 
على حواجز تحصيل الرسوم» مما يؤدي إلى سرعة أعلى في حركة ال مركبات والدفع «JI‏ 
بالإضافة إلى حساب معدل حركة OLS AI‏ او عدد مواقف السبارات امتاحة لإدارة حركة 
المرور. كما 25 رقائق تحديد الهوية باستخدام موجات الراديو على الحافلات والقطارات 
والتي تتواصل مع قارئ الموجات الراديوية على طول مساراتها مما يجعل من الممكن تتبع 
موقع ال مركبات في أي لحظه Ll‏ 

كما يمكن إنشاء شبكة استشعار كثيفة من خلال توزيع العديد من أجهزة الاستشعار 
وربط البيانات التي تنتجهاء مما يتيح رصد أوضاع مختلفة عبر نظام أو مكان ما. وقد 
توالت الأمثلة على هذه الشبكات وأجهزة الاستشعار في مدينة سانتاندر (Santander)‏ في 
إسبانيا كجزء من مشروع às‏ الذكبية .(SmartSantander)‏ وفبه 12000 من أجهزة 
الاستشعارء وتتكون من خمسة آنواع» تم توزيعها بشكل إستراتيجي في جميع أنحاء المدينة 
لقياس الضوضاءء والحرارة» ومستويات الإضاءة ا محيطة: وتركيز Jal A‏ أكسلد الكربون: 
والأماكن المتوافرة لوقوف السيارات وركنها )2013 (Bielsa‏ وترتبط أجهزة الاستشعار معا 
من خلال الاتصالات اللاسلكية وتوظيف البرمجة عبر الأثير (OTAP)‏ مما يمكن من برمجتها 
وتحديث برمجياتها عن بعد )2013 816153). كما يجري تطوير وادي بلان اي ت (PlanIT)‏ 
في البرتغال. وهو في الوقت الحاضر تحت الإنشاء ومصمّم لإيواء 225 آلف نسمةء ويهدف 
إلى إنشاء بيئة قائمة على أكثر من 100 مليون جهاز استشعار مدمج فيها والتى سوف تنتج 
يانات لرصد مجموعة degu‏ من البنى .(Marchetti 2012) Skla duol‏ وهكذاء 
تنظر laeso Col siad I‏ عنهرا Ls]‏ في التطورات التى تشهدها المدينة الذكية. 


بيانات المسح الضوتي (Scan Data)‏ 

بالاضافة إلى الأجهزة الرقمية وأجهزة الاستشعار التي تنتج البيانات بشكل نشط والتي 
هى sym‏ من شبكة إنترنت الأشاء من ال ممكن رصد وتتبع الكائنات $521 Lido‏ من خلال 
;592 الهوية المقروءة ui‏ وقد تجاوز استخدام الرمز الشريطي (Barcode)‏ قطاع البيع 
بالتجزئة ليشمل السلع ال مصنعة والاستمارات الرسمية» كما وضعت العديد من ال منظمات 
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الكبرى والقطاعات الصناعية نموذجها الخاص من الرمز الشريطي ومعاييرها لتخصيص 
الأرقام )2005 JE gs „(Dodge and Kitchin‏ السانات à‏ الرموز الشريطية LSLS‏ الأبعاد 
L. ls Lal‏ مجموعة من النقاط المرقطة وممكن استخدامها لتحديد كائن بشكل فريد. 
وتستخدم بعض خدمات البريد هذه الرموز الشريطية الثنائية الأبعاد لتمكين المتابعة 
والتعقيب للرسائل والطرود البريدية بشكل فردي. وبامثل» تحتوي الشرائط ا مغناطيسية 
المشبتة على بطاقات الائتمان والولاء وبطاقات السماح بالعبور من خلال الأبواب على معرّف 
فريد يختص بصاحب البطاقة التي يتم قرا Ue‏ عند تمريرها على القارئ. وقد جرى استبدالها 
لاحقا برقائق إلكترونية هكن التحقق من البيانات التفصيلية فيها باستخدام الأرقام السريّة 
الشخصية لمستخدميها. كما يتم إنتاج البيانات الخاصة بالاستعمالء في كل مرة يجري فيها 
مسح الرمز الشريطي أو الشريط المغناطيسي أو الرقاقة الإلكترونية, متضمنا ذلك أين ومتى تم 
الاستخدام ولأي غرض. وبالنظر إلى أن الغرض من هذا المسح ف كثير من الحالات هو لشراء 
السلع» فهي توفر وسائل مهمة لإنتاج معلومات عالية الدقة والتفصيل للضفقات المبرمة. 


البيانات التفاعلية :(Interaction Data)‏ 
على الرغم من أن بعض مستخدمي الإنترنت ينظرون إليها باعتبارها وسطا مجهول 
ا معام إلى i>‏ ماء إلا أن كل تفاعلات المستخدمين الجارية عبر شبكات المعلومات والاتصالات 
تنتج بيانات تفاعلية. وحقيقة: فإن cil‏ البيانات هو قائم بطبيعته على العديد من أشكال 
الاتصال والاستخدام في شبكات تقنية المعلومات والاتصالات. على سبيل «JUL‏ يتعقب 
مزودو خدمات الإنترنت المواقع التي تتصل بها حسابات المستخدمين الفردية والأجهزة. 
وتستخدم العديد من المواقع» وخاصة مواقع الشركات» سجل التتبع وتعريف الارتباط 
للمتصفح (كوكيز (Cookies‏ لإنتاج بيانات النقر (اختيارات المستخدم). لتتبّع كيفية تنقل 
المستخدم خلال ا موقع على شبكة الإنترنت وما الميزات التي جرى اختيارها. وبشكل ele‏ 
تستخدم مثل هذه البيانات لمراقبة LAS‏ أداء الموقع الإلكتروني؛ وإجراء أبحاث عن السوق 
ziig‏ مسار إنتاجية الموظف» مع إمكانية بيع هذه البيانات إلى أطراف أخرى. ويتم 
إنشاء بيانات النقر هذه بصورة تلقائية ما لم يعد المستخدم تطبيق المتصفح لعدم قبول 
ملفات تعريف الارتباط (وهذا قد يضعف استخدام الموقع). وباطثلء يتم تخصيص رموز 
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تعريفية فريدة في جميع الصفقات امالية القائمة على تكنولوجيا المعلومات والاتصالات. 
سواء الخدمات الخ فة الشخضية الالككترونية: أو عملنات سحب أموال من أجهزة الضراف 
JYI‏ أو عمليات المتاجرة في الأسهم» ويجري تخزين بيانات هذه المعاملات تباعا. وتحتوي 
جميع رسائل البريد الإلكتروني على رؤوس في مقدمة حزم بياناتها والتى تقوم بتحديد البريد 
الإلكتروني بشكل فريد» وتحتوي على معلومات تشمل المرسل والمتلقيء والخوادم والأجهزة 
المستخدمة. وعلى المنوال نفسه. يتم تمييز جميع ال مكالمات الهاتفية معلومات المتلقى 
ÄLL‏ ووقت إجرائها ومدة بقائهاء وما إذا كان الهاتف محمولاء والموقع. ونتيجة لذلك 
يتم إنشاء كميات هائلة من البيانات بشكل روتيني glio‏ التفاعلات الحاصلة عبر شبكات 
Log ys‏ المعلومات والاتصالات. 


البيانات التطوعية :(Volunteered Data)‏ 
على النقيض من المراقبة الموجهة إلى الأشخاص أو الأشياء من قبل الأفراد «als‏ 
أو تلك التي يتم التقاطها تلقائيا باعتبازها ميزة متأصلة لجهاز أو نظام ماء فإن كثيرا 
من البيانات الكبيرة يتم إنتاجها من قبل الناس بشكل تطوعى فعال. ففي مثل هذه 
الحالات» ينتج الأفراد البيانات ويقومون بإدخالها للعمل على الاستفادة من خدمة 
(مثل وسائل التواصل الاجتماعي)» أو المشاركة في مشروع جماعي مثل مشروع خريطة 
الشارع المفتوح gl (http://www.openstreetmap.org)‏ موسوعة الانترنت ويكسيديا 
Jdi „owg .(https://www.wikipedia.org)‏ هذا العمل بالإنتاج الاجتماعي 
(Prosumption)‏ حبث تختلط bli‏ الإنتاج والاستهلاك L.5se-‏ بعضها قي بعضء» 
مع اكتسينات has 31, 3I‏ ق إنتاج الخدمة أو ex‏ الذي يستهلكونه Ritzer and)‏ 
.(Jurgenson 2010‏ فعلى سبيل «JUL‏ يجري إنتاج واستهلاك محتوى مواقع التواصل 
الاجتماعي في ذات الوقت من قبل الأفراد المستخدمين عن طريق إدخال التعليقات. 
تحميل الصور ومقاطع الفيديوء والمشاركة في مناقشة وتبادل ال مشاعر («الإعجاب» 
sl‏ «عدم الإعجاب» للشيء). ومن خلال جهودهم الجماعيةء ينشئ الأفراد المنتجات 
والخدمات التي يشاركون فيها ويضيفون قيمة لها ويستخرجون القيمة منهاء بحسب ما 
jù‏ إليه )2006( Benkler‏ بمصطلح «ثروة الشبكات». وفي معظم الأحوال؛ يقوم أفراد 
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الإنتاج الاجتماعي بهذا العمل الإضافي بمقابل مادي قليل أو دون أي تعويضء وذلك إما 
للحصول على متعة المهمة» أو الشعور بالسلطة» أو توفيرهم ال مال والوقت مع انخفاض 
تكلفة الخدمة والتى غالباً ما تصبح أكثر مرونة بطبيعتها مثل الخدمات المصرفية عبر 
الإنترنت أو الحجز في رحلة طيران من المنزل. ف المقابل: يتلقى مزود الخدمة أو متاجر 
التجزقة عملا دون تكلفة: نالإضافة إلى الخرات والآراء والمعرفة واكتساب الكفاءة 
ومعلومات ذات قيمة من خلال القرب أكثر من العملاء / الزبائن والقدرة على تسسل 
بياناتهم )2013 .(Ritzer and Jurgenson 2010; Dodge and Kitchin‏ فیعض أشكال 
الإنتاج الاجتماعي هي أقرب إلى الخدمة الذاتية ومقيدة بطبيعتهاء مع قيام أفرادها بالأعمال 
التي كانت مسندة إلى موظفينء في حين أن البعض الآخر أكثر انفتاحا وتفاعلية. وهنا 
سيتم مناقشة خمسة أشكال للسانات التطوعية باختصار: اماملا (Transactions)‏ 
ووسائل التواصل الاجتماعي (Social Media)‏ وامراقة الحبة (Sousveillance)‏ 
والتعهيد الجماعي (Crowdsourcing)‏ وعلم المواطنة (Citizen Science)‏ 


المعاملات (Transactions)‏ 
يتطلب الشراء عن طريق الإنترنت من المشتري إدخال البيانات الشخصية له فيما يخص 
ilas‏ الدفع والعنوان وغيرها من البيانات الوصفية الضرورية الأخرى باعتبارها جزثيا 
ilas‏ للتحقق وتبادل المعلومات ولكن Lal‏ لمعرفة المزيد عن المستهلك. وعادة ما تكون 
التفاعلات في مثل هذه التبادلات محدودة إلى حد ماء وتقتصر على اختيار ماهية بنود 
الشراء» والعديد من حقول البيانات الإلزامية لوضع اللمسات الأخيرة وإتمام عملية الشراء. 
وبعد تبادل اممعلومات» من ال ممكن طلب امزيد من المعلومات من المستخدمينء إما لتقييم 
أداء الموقع وخدمة العملاءء أو لتصنيف ومراجعة بيانات البند الذي تم شراؤه. وتضيف 
بيانات ال مراجعة هذه قيمة للموقع من خلال اقتراح LAS‏ تحسين التصميم وكذلك تزود 
ا مستهلكئن الآخرين بردود الأفعال (Feedbacks)‏ عن مدى جودة وكفاءة ال منتجات. فعلى 
مواقع الكترونية مثل «(http://www.tripadvisor.com)‏ مكن ÀY‏ اد الإنتاج المجتمعي 
تقييم واستعراض الفنادق وخدمات السفر الأخرىء مثل البيانات التي يجري تقدهها طوعا 
على الموقع عن حركة المرورء وبث الإعلانات والإشارة إلى مواطن الربح المحتملةء مما يكون 
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له تأثير ملحوظ في اختيارات المسافرين الآخرين. كما يوفر الموقع بيانات مفيدة حول 
الشخص الذي تطوّع لإجراء الاستعراض والتقييم» مثل خيارات أسلوب الحياة والإنفاق 
خلال السفر التي يمكن تسييلها ماليا عن طريق بيعها إلى أطراف ثالثة. «Jos‏ تتطلب 
تعبئة النماذج الإلكترونية الحكومية من المواطن تقديم معلومات للموقع بشكل تطوعي. 
وهناء يكون Uia‏ تبادل للبيانات يتعدى حدود عملية الدفع للمبالغ النقديةء فبعض 
البيانات الإضافية الأخرى يمكن أن تكون مرتبطة باط معاملات» مثل Ollo‏ مسار النقر على 
الصفحات ومعلومات بطاقة الولاء مما يتيح بناء ملف مبدن للشخص هكن البناء عليه مع 
مرور الزمن أو يتم ربطه مع مصادر البيانات الأخرى مثل بيانات التوزيع الجغرافي للسكان. 


التواصل الاجتماعي (Social Media)‏ 
قبل :العام eY‏ كانت شسبكة الإنترنت إلى Xo‏ كبر lus‏ للبث الإغلامئ يمكن من 
خلالها للناس تقديم المعلومات أو شراء البضائع. وكانت هناك لوحات الإعلانات والقوائم 
البريدية التي يستطيع الناس من خلالها التواصلء ولكنها كانت قائمة على استخدام النصوص 
فقطء ومحددة بطريقة عرض بدلا من كونها وسيلة مفتوحة وعامة. وبينما هكن للأفراد 
إنتاج أشكال أخرى من ال محتوى Jis‏ صفحات الويب» إلا أن ذلك يتطلب المهارة لإنشاء 
مثل هذه الصفحات وشراء اسم النطاق» وكانت هذه الصفحات ثابتة إلى حد كبير وينبغي 
تحريرها بشكل رئيسي على الطريقة اليدوية ليجري تحديثها. واعتبارا من العام ۲٠١۶‏ 
وعلى الرغم من «S05‏ بدأت طبيعة شبكة الإنترنت بالتغيّر لتصبح أكثر تفاعلية وتشاركية 
ودينامية, وقد تم الإشارة إلى هذا التحول على أنه الانتقال من إصدار شبكة الويب الأول 

(Web 1.0)‏ إلى الإصدار الثانى )2005 (Web 2.0) (O'Reilly‏ . 
وعوضا عن محتوى الويب الذي يجري تقدهه إلى Jor‏ كبير من قبل ا مختصين ومصممي 
ا مواقع الإلكترونيةء فقد أصبح لآي شخص إمكانية إنشاء محتوى يمكن تحديثه بشكل 
مستمر. وعلاوة على ذلك» مكن الوصول إلى هذا ا محتوى والتفاعل معه من خلال 
مجموعة متنوعة من المنصات مثل الهواتف ASI‏ والأجهزة Ao gll‏ وبدلا من مجرد 
xias‏ المعلومات أو تقييدها في مناقشات ضيقة نسبياء أصبح من الممكن للناس المشاركة 
بسهولة وبشكل فعال في إنتاج عام الإنترنت وتصميم وتحرير المحتوىء والإسهام بحرية في 
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الخدمات التي تتبادل ا مواد مع الآخرين. وفي حين تم اعتبار الإصدار الأول لشبكة الويب 
Us us (Web 1.0)‏ للقراءة olè «da‏ الإصدار الثاني لشبكة الويب )2.0 (Web‏ هو وسط 
للقراءة والكتابة هكن للناس من خلاله إضافة قيمة للمواقع عندما يقومون باستخدامها. 

وتميل مواقع الإصدار الثاني من الويب وخدماتها إلى التركيز على النشر من العديد - 
إلى - العديد. والتواصل الاجتماعيء وتوفير معلومات أكثر ثراء واتساقا. وتشتمل الأمثلة 
على خدمات الشبكات الاجتماعيه على سبيل امثال الفيسبوك وتويتر؛ والصور ومواقع 
مشاركة الفيديو على سبيل JELI‏ فليكر ويوتيوب؛ والمدونات؟ وعمليات المزج باستخدام 
واجهات برمجة التطبيقات ال مفتوحة (APIS)‏ لدمج البيانات من مصادر مختلفة لإنشاء 
تطبيقات جديدة على سبيل «JULI‏ فورسكويرء وييلب .(Yelp)‏ وتعتمد هذه المواقع كلها 
على المشاركة الفعالة من جمهور متحمس لتبادل المعلومات حول حياتهم والقيام بأعمال 
من قبيل الكتآبة#التحريرء التظنيق: التعديلء النشرء المنشاركة: الوسنة: التواصل ... إلخ 
.(Beer and Burrows 2007)‏ وعند القيام بذلك» فهم Y‏ يتطوعون بالعمل فقطء ولكن 
بالكثيز من البيانات عن «ea ail‏ متضمنا ذلك الملفات التعريفية, الصور, المواقت» الآراء 
التفضيلات. «e JI‏ وشبكة اتصالاتهم الاجتماعية. Yg‏ قد جرى تملك هذه المواقع من 
قبل مجموغة شر کا تاسئست dao‏ فإنه يجري تداول البيانات في أيدي مملوكة للقطاع 
الخاص والتي تسعى بدورها لإنتاج نماذج جديدة من تراكم رأس JUI‏ عن طريق استخراج 
القيمة منها (انظر الفصلين الثاني والسابع). 


المراقبة الذاتية :(Sousveillance)‏ 

المراقبة الحية هي الرصد GIUI‏ وإدارة صحة الفرد الشخصية وحياته من خلال التقنيات 
الرقمية الحميمة على سبيل JELI‏ معدات à SUUI‏ البدنية» والحوسبة القابلة للارتداء 
لتسجيل السانات المتعلقة بالفرد )2003 Aes .(Mann et al.‏ النقيض من 8l Ll‏ & 
الإشرافية (Surveillance)‏ والتي يتم فيها مراقبة الفرد من موقع خارجي بواسطة شخص 
اخرء يجري توظيف وضبط الراقبة الذاتية عن وعي وإدراك الفرد لتحقيق الذات» وتوفير 
منظور داخلي 5l‏ عن حياته. وعلى مدى العقد (sali!‏ تطورت حركة امراقبة الذاتية من 
أناس يراقبون ويسجّلون بنشاط بياناتهم الشخصية والتي تُعرف أيضا باسم حركة القياس 
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الكمي للذات أو التتبع الذاني (Quantified Self) Las‏ وبشكل ele‏ براقب الآفراد جوانب 
الصحة واللياقة 5441« ويجمعون بيانات الاستهلاك (على سسيل JELI‏ المواد الغذائية / 
السعرات الحرارية)ء والحالات الجسدية (مثل ضغط al‏ والنبض)ء والحالات العاطفية 
(على سبيل المثالء المزاج ومستويات الإثارة) والآداء (على سبيل JELI‏ أميال المشي/ الركض 
/ الدوران المقطوعة. وعدد ساعات النوم» وأنواع النوم)» بالتعاون مع عدد من الشركات 
التي asi‏ التقنيات والخدمات ال مرتبطة بالمراقبة الذاتية. وتشمل شركات مراقبة الأنشطة 
الرياضية والنوم» على سبيل المثالء شركات من أمثال فت بت» ونايك بلس» فيول باند 
وجوبون (Fitbit, Nike+, Fuelband, and Jawbone)‏ والتی تعمل على مزامنه البيانات 
الناتجة مع تطبيقات متابعة وتعقب تسمح للمستخدم برصد وتحليل بياناته الشخصية. 
ولا يجري بالضرورة مشاركة البيانات التي تم إنتاجها على نطاق أوسع: على الرغم من 
إمكانية خدوث ذلكء ولكن يجري مشاركتها مع الشركات المزؤدة للخدمة؛ مها يوفر لهم 
اطلاعا نافد e‏ البياناة)الشخصة! 

à sis‏ هذه التقنيات في ا مرحلة الأولى من التطوير وهناك رؤى أكثر شمولا لتسجيل 
سيانات (Life Logging) ölə‏ التي تعمل على إنشاء سجل رقمي موحد لخرات الأفراد. 
من خلال جمع متعدد الطرق عبر أجهزة استشعار رقميةء وتخزينها بشكل دائم كأرشيف 
شخصي متعدد الوسائط )2003 (Mann et al.‏ وذلك مع عدد من نماذج الأبحاث التي 
يجري تطويرها حاليا. وتهدف سجلات بيانات الحياة إلى إنشاء سجل متصلء وقابل للبحث 
والتحليل لماضي الشخص الذي يشمل JS‏ عمل» أو كل حدث» أو كل محادثة» أو كل 
موقع تمت زيارته» أو أي تعبير مادي متصّل بحياة الفرد. فضلا عن الظروف الفزيولوجية 
داخل الجسم والأوضاع الخارجية المحيطة به (على سبيل JUI‏ الوجهة» ودرجة الحرارة 
ومستويات التلوث) C - (Dodge and Kitchin 2007b)‏ مجمل ال معلومات التي تتدفق 
خلال eU»‏ الإنسان (85 :2003 .(Johnson‏ ومن الواضح أن etu‏ هذه السجلات عن 
الحياة يثير عددا من الأسئلة glis‏ الخصوصية: وملكية البيانات المنتجة. وطريقة استخدام 
هذه السانات (Dodge and Kitchin 2007b)‏ 
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التعهيد الجماعي :(Crowdsourcing)‏ 

التعهيد الجماعي هو الإنتاج المشترك لوسائط الإعلام: والأفكارء والبيانات من خلال العمل 
التطوعي من قبل العديد من الناس لحل مهمة معينة. وبينما يمكن القول Ob‏ محتوى وسائل 
التواصل الاجتماعي هي نتاج تعهيد جماعي بمعنى أنه يتم الحصول عليه من قبل عدد كبير 
من الناس» إلا أن الغرض من هذه المحتوى Eige‏ وواسع الانتشار ويفتقر إلى التركيز. فبدلا 
من ذلك» يركز التعهيد الجماعي على الإنتاج التعاوني للمعلومات وإنشاء حلول لقضايا معينة 
من خلال الاعتماد على الطاقة» وال معارفء واطهارات: والعمل التوافقي والجماعي لحشد من 
الناس )2008 (Howe‏ وقد بين )2008( Howe‏ أن هناك أربعة تطورات تدعم نمو التعهيد 
الجماعي: نهضة الهواة (بحسب المعايير المهنية في الغالب)ء وظهور حركة البرمجيات مفتوحة 
المصدرء وزيادة وفرة أدوات الإنتاج خارج إطار الشركات ا لمصنعة: وصعود مجتمعات محلية 
حيوية ومنظمة وفقا لاهتمامات الناس وميولهم على شبكة الإنترنت» فهذه التطورات 
مجتمعة ES‏ من تجميع موزع ودممقراطي للأفكار والآدوات lablo‏ وهناك W‏ أنواع 
رئيسنية من التعهيد الجماعي التي تعمل في الوقت الحاضر: تلك التي تنتج حلا بشكل 
جماعي على سبيل JELI‏ خريطة الشارع امفتوح (http://www.openstreetmap.org)‏ 
ويكيبيديا Wg t(https://www.wikipedia.org)‏ التي تستخدم الجمهور لتقييم حلول أو 
منتجات متعددة على سبيل «JULI‏ موقع شركة أمازون (https://www.amazon.com)‏ 
ومستشار الرحلات (5://101010.61122051501:20112])؛ وتلك التی تسعى إلى حل واحد 
أو أكثر من الجمهور على سسل JELI‏ إنوسنتف (/https://www.innocentive.com)‏ 
واملتقيات المكثفة مطورى البرمجيات (Hackathons)‏ 


وبخصوص النوع الأول أصبح إنتاج المعلومات (خريطة مفتوحة المصدرء موسوعة قابلة 
للتعديل والوصول إليها بحرّية ) تعاونياء وعملا من إنتاج الأفراد. مع إعطاء المشاركين 
الحقوق والتسهيلات لتعديل وتنقيح وإسهاب الشرح لمساهمات الآخرين Benkler)‏ 
6).. فمن خلال العمل عبر شبكة الإنترنت مكن لأى أحد له قدرة النفاذ إليها من أن 
يسهم ويضيف إلى مجمّع الخبرات المحتملة ونطاق المشاريع مقابل تكلفة «JB!‏ وضمان 
ممارسة مختلف وجهات النظر والتقنيات على المشروع )2011 (Weinberger‏ وف الواقع: 
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فإن إنتاج خريطة مفصّلة للعامم أو موسوعة شاملة مع عدد قليل من المهنيين هي مهمة 
صعبة ومكلفة» وببساطة شاقة للغاية بالنسبة لمجموعات صغيرة من المتطوعين. ولكن 
بالنظر إلى آلاف المشاركينء يمكن تجزئة المهمة عليهم وحلها. وسيكون المقابل الذي سيجنيه 
ا مشاركون هو إنتاج بيانات مفتوحة المصدر خالية من حقوق الطبع والنشر والرخص 
المكلفة LS)‏ هو الحال مع بيانات الوكالة الوطنية لرسم الخرائط) Dodge and Kitchin)‏ 
3). وبالمثلء يمكن لشركة أمازون وغيرها من شركات التجزئة على الإنترنت» من خلال 
تمكين المستخدمين من استعراض امنتجات التي يشترونهاء استخدام قوة الجماهير مراجعة 
ومشاركة آرائهم حول هذه ال منتجات. كما أن الفائدة التي تعود على المشاركين هي تبادل 
الرأي فيما يتعلق بالمزايا النسبية للسلع والخدمات. 

ويعد استخدام المسابقات لتحفيز الجماهير على اقتراح حلول مقابل جائزة من أشكال 
التعهيد الجماعي الخاصة والذي تستخدمه بعض الشركات لتقديم الخبرات والأفكار 
.(Weinberger 2011)‏ فعوضا عن اللجوء للمناقصات والاستعانة مجموعة محدودة من 
الخبراء المحتملينء تفتح شركات مثل إنوسنتف (Innocentive)‏ وتوب كودر (TopCoder)‏ 
المQشكلة‏ من خلال الإعلان عنها لأى شخص مهتم» وتقدم à‏ العادة من عشرة الاف إلى مئة 
ألف دولارء وأحيانا أكثر من ذلك بكثيرء لإيجاد حلول ممشاكل العملاء. وهناء يكون الجمهور 
هو مصدر الحلء ولكن لا يعمل الأفراد بعضهم مع بعض بشكل جماعيء وتكون الفائدة 
بالنسبة للشركات هي خيازات الحل المقدمة وللمشاركين هي العائد IS) JU‏ تم اختيار 
الحل الخاص بأحدهم. وعلى نحو مماثل» تسعى مسابقات بيانات التطبيقات المفتوحة 
التي تعقدها المجالس البلدية إلى تقديم مكافآت أكثر تواضعا مقابل تطبيقات أكثر فائدة 
وإثارة للاهتمام. ويمكن eda)‏ المسابقات أن تأخذ شكل الملتقيات المكثفة للمطوري البرمجيات 
(Hackathons)‏ التي يعمل الناس فيها معا في فرق لتطوير حلول تطبيقات» وعادة ما 
تمتد على مدى يوم أو خلال عطلة نهاية الأسبوع. وتتمثل الفائدة العائدة على البلدية في 
استخدام بياناتها من أجل الصالح elol‏ وشهرة المواطنين: والمشاركة المدنية. 
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علم المواطنة :(Citizen Science)‏ 
ele‏ المواطنة هو شكل من أشكال التعهيد الجماعي حيث تعمل مجتمعات أو شبكات 
من امواطنين dia‏ مراقبين في بعض مجالات العلوم )218 :2007 .(Goodchild‏ هناء 
يقوم الناس بإنتاج وإعداد ومعالجة الملاحظات العملية التجريبية: والقياسات التفصيلية 
للظواهر بالمجانء والتي تعد» حاسمة ومفصلية»ء وذات قيمة حقيقية blis‏ بيانات للعلوم 
الصحيحة. ويكون علماء المواطنة ذوي فائدة بشكل خاص من حيث الرصد لأنهم قل 
يكونون موزعين جغرافيا ومُدرجِين ضمنا في المكان عبر الزمن حيث من الصعب على 
مستويي التنسيق والتكلفة استخدام مساعدي البحوث اطهنيين لجمع القياسات الميدانية. 
ومن الأمثلة على ذلك. قياسات هواة الرصد الجوي الناتجة من محطات الحدائق الخلفية 
للأرصاد d gal‏ وهواة ele‏ الفلك الذين يراقبون السماء ليلا بدقة. وقد أصبح علم المواطنة 
lc;‏ خلال القرن العشرينء. وذلك bes‏ لرواج العلم وتعميمه»ء ولكن لا Jl»‏ النشاط ضشلا 
ويعتمد على درجة معقولة من المهارات وال معارف والمعدات المتخصصة مثل مرقاب $3 

نوعية جيدة. وفوق ذلك قدر كير من التحفيز والالتزام المستمرين. 

وقد صتف )2012 .(Bonney et al 2009; cited in Miller-Rushing et al.‏ أشكال 

ele‏ المواطنة في ثلاث فئات: 

e‏ التساهمية (Contributory)‏ وتصمم بشكل ele‏ من قبل العلماء ولأجلها بسهم الأفراد 
عامة بالبيانات في المقام الأول. 

٠‏ التعاونية :(Collaborative)‏ وتصمم بشكل ele‏ من قبل العلماء ولأجلها بسهم الأفراد 
عامة بالبيانات» ولكن قد يساعدون أيضاً على تحسين تصميم المشروع: وتحليل OBLI‏ 
ونشر النتائج. 

o‏ الإنشاء ا مشترك :(Co-created)‏ وتصمم من قبل العلماء وأعضاء من عامة الجمهور 
يعملون معا ولأجلها ex‏ إشراك بعض عامة المشاركين على الأقل ف معظم أو جميع 
خطوات العملية العلمية؛ ويشمل ذلك أيضا البحوث التي وضع تصورها وتم تنفيذها 
من قبل علماء هواة (غير مهنيين) بشكل كامل. 
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às‏ العادة يختلف مسنوی الخيرة ونوع امشاركه بحسنا الفئةء مع مشاركه اطواطنين 

العلماء فقط من $33 obl‏ الأكثر تقدما 3 مشاريع الإنشاء اممشترك. ومكن أن Ax‏ 

امشاركه عددا من الأشكالء مما في ذلك: 

o‏ الحوسبة الموزعة: حيث يضيف أحد المشاركين قوة معالجة حاسوبية من أجهزة الحاسس 
الشخصية الخاصة به إلى المشروع» مما يسمح doles‏ البيانات باستخداء اموارد 
الحاسوسة منها (التساهمية). 

«JULI النسخ / التحويل / الرقمنة: تحويل شكل من أشكال البيانات إلى آخرء على سبيل‎ o 
تحويل وثائق مكتوبة بخط اليد إلى نص رقمي (التساهمية).‎ 

o‏ قياسات الرصد: ينتج العلماء البيانات» ولكن يستخدم ele‏ المواطنة لإجراء القياسات 
باستخدام أدوات محددة يجري تورددها لهم (التساهمية). 

٠‏ جمع البيانات: يجمع أفراد ا مواطنين البيانات ومن ثم يقومون بمشاركتها مع العلماء 
(التساهمية). 

e‏ تحليل الرصد: يقوم أفراد المواطنين بإجراء بعض التحليلء Le‏ في ذلك توفير بعض التفسيرات 
لما قد تعنيه النتائج» بدلا من مجرد الاكتفاء بإنتاج أو قياس البيانات (التعاونية). 

Šol (523 0‏ وتششله: يقوم أفراد امواطنين ددور EE à lx‏ وتشغصل E gridb‏ 
فضلا عن نشر النتائج والاستنتاجات (الإنشاء المشترك). 


(Open Scientist 2013) 


الخلاصة: 

35155( هذا الفصل إلى العوامل المساعدة للبيانات الكبيرة ومصادرها. وتم بيان أن إنتاج 
البيانات الكبيرة قد تبسر بفضل التقاء خمسة ابتكارات تقنية من بداية الألفية الجديدة 
فصاعدا وهي تنامي قوة المعالجة الحاسوبيةء وكثافة التشبيك الحاسوي» والحوسبة ا منتشرة 
والحوسبة في كل مكان» والتعرّف وتحديد الهوية من خلال زيادة قابلية الفرز والقراءة LIT‏ 
وأخيرا التخزين امموزع الواسع النطاق. وقد OS‏ هذه التطورات مجتمعة إلى مجموعة 
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متنوعة من النظم الاجتماعية التقنية التي تنتج البيانات الكبيرة. وقد قدم هذا الفصل 
مسار تتبع أولي لهذه الأنظمة. حيث قسّمها إلى ثلاث فتات واسعة النقاط من أشكال إنتاج 
البيانات: ا موجهة. والآليةء والتطوعية. وينبغي النظر إلى مثل هذا امسار باعتباره خطوة 
أولية في محاولة وضع خريطة لمشهد يتكشف باستمرار. وما هو مطلوب Ut‏ يتمثل في 
مجموعة مفصلة من الدراسات التجريبية التي ندوس JS to‏ أكثر las‏ الطرق المختلفة التي 
يتم بها حالياً إنشاء ومعالجة واستخدام البيانات الكبيرة. كما تحتاج مثل هذه الدراسات 
إلى رسم أصول التقاء هذه التقنيات الممكنة وفك مجاميع البيانات التي تم أنشاؤها وكيف 
تطبق Glas‏ لإنتاج أشكال معينة من البيانات الكبيرة (انظر الفصلين 1 و11). وهذا يشمل 
تفكيك polis‏ النظام المرتبط بها (انظر الفصل 7). وعند القيام بذلك» هكن الحصول على 
أفكار ورؤى أكثر عمقا لكل نظام اجتماعي تقني ولمختلف العمليات والضوابط والسياسات 
امتصلة »4« والعمل المتنوع الذي agi‏ به في هذا العام. 

كما ينبغي لمجموعة مصاحبة من الدراسات أن تختبر ما قد يحدث عند ربط 
النظم الاجتماعية التقنية معا لإنشاء أنظمة جديدة أكبر والتي من خلالها تنتج الآثار 
الهامة لتضخم البيانات. كما أن التقنيات التي تقوم عليها البيانات الكبيرة: والبيانات 
نفسها من خلال علائقيتها. هی Lail‏ جاهزة Lh‏ هذه التوسعات. ف الواقع» تكون 
مجاميع اجتماعية تقنية 1 Gaizo (Socio-‏ مثل سلسلة polio‏ التجزئة 
الكبيرة كوومارت (Walmart)‏ 5 تقوم تقوم وعلى نحو متزايد. بربط العديد من الأنظمة 
مثل إدارة سلسلة التوريد «(Supply Chain Management)‏ تخطبط موارد 
امؤسسات (Enterprise Resource Planning)‏ ادارة علاقات العملاء Customer)‏ 
(Store Management) (55; 4! öylə! «(Relationship Management‏ وأنظمة 
الأمن (Security Systems)‏ والتى تنتج أشكالا من OU UI‏ المطوجهة: AJ Yla‏ والتطوعية 
لإنشاء منظمات معقدة ومتطورة موجهة بالبيانات والتي تترتب عليها آثار متنوعة على 
اموردين واطوظفين وا مستهلكين. وباطثلء Jgls‏ مراكز السيطرة والتشغيل للمدن 
الذكية دمج أنواع مختلفة من البيانات التى تم جمعها من مصادر مختلفة في مركز 
واحد حيث يتم الجمع بينها وتحليلها بشكل ني أو (Real-Time) „hoJ‏ مما z%‏ 
بشكل جذري الطريقة التي تدار وتحكم بها التجمعات المدنية (انظر الفصل السابع). 
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ممكنات البيانات الكبيرة ومصادرها 


وقد أثار Jio‏ هذا التوسع وإعادة الضبط العديد من الأسئلة الاجتماعية والسياسية 
والأخلاقية والمعيارية المتعلقة بأنواع الأنظمة والأماكن التي نريد العيش داخلهاء وقد 
bis‏ بالكاد أن JUS‏ ونجس عن هذه الأسئلة (انظر الفصل العاشر). 
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الفصل السادس 
DLJI‏ تحليل البيانات (Data Analytics)‏ 


لسست السانات dos‏ ذاتها مفيدة: كما أنها لسست ذات فائدة إلا إذا أمكن استخلاص 
معنى وقيمة منها. وبعبارة أخرىء فإن ما يمكن فعله حيال البيانات هو pal‏ أهم من مجرد 
عملية إنتاجها؛ إذ ترتكز جميع العلوم على تحقيق معنى وقيمة من البيانات. إن إيجاد 
واستشعار المعنى من البيانات الصغيرة الموسعة والبيانات الكبيرة ينطوي على تحديات 
جديدة. ففي حالة البيانات الصغيرة الموسعة: يكمن التحدي في ربط قواعد البيانات 
امتنوعة للحصول على رؤى جديدة. وانفتاح البيانات لتقبل ال مناهج التحليلية الجديدة 
التي يجري استخدامها مع البيانات الكبيرة. أما بالنسبة للبيانات الكبيرةء فيتمثل التحدي 
في التكيّف مع الوفرة والشمولية (متضمنا ذلك الكميات الكبيرة من البيانات ذات الفائدة 
والقيمة المنخفضة). وامناسبة الزمانية والديناميكية: والفوضى وعدم اليقينء والعلائقية 
«d Lll‏ والطبيعة شبه المنظمة وغير ا منظمة. وحقيقة أن يتم إنتاج الكثير من البيانات 
الكبيرة دون آي سؤال محدد في العقل لتجيب عنه أو أنها في صحبة منتج هو نتيجة ثانوية 
لنشاط آخر. فالواقع» وحتى وقت قريبء تم تصميم تقنيات تحليل البيانات بشكل أساسي 
لاستخلاص رؤى من مجموعات بيانات شحيحه» وتابته» ونظيفة. وضعيفة العلائقيه» وجرى 
جمعها بطرق علمية وملتزمة بافتراضات صارمة مثل الاستقلاليةء والثبات» والعيارية» كما 
جرى إنتاجها وتحليلها مع وضع سؤال محدد ف الاعتبار )2010 (H.J. Miller‏ 

حتى وقت قريب كان تطوير أدوات للربط بين مجموعات البيانات المختلفة وتحليل 
البيانات الكبيرة ضعيفا؛ بسبب التعقيد المرتبط بتطوير هذه الأدوات من الناحية 
الحاسوبية. bg‏ يجر تحليل مجموعات البيانات الضخمة بشكل منتظم سوى ف السنوات 
الأربعين الماضة أو نحو ذلك. وحتى ذلك الحين كانت هذه التحليلات قائمة غلى منادرات 
خاصة قادرة على تحمل الموارد AW‏ ويدون طاقة خاس JL ANI eul idle dos‏ 
ويمكن النفاذ إليهاء سيكون إيجاد واستشعار المعنى من طوفان البيانات الهائل مكلفا 
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الفصل السادس 


للغاية أو صعب التطبيق ويستغرق Ég‏ طويلا. وبالطبع» هناك نوع ما من الجدل الدائر 
في الواقع هنا؛ إذ دون الحوسبة الواسعة الانتشار في كل مكان م يكن es]‏ البيانات الكبيرة 
ليكون في امقام الأول. ومع US‏ كما ذكر Hastie et al. (2009: xi)‏ فإنه بالنظر إلى 
دظهور الحواب يي وعضر المغلومات: فقن تفاقنت لماكل الفمصائية مق جيف الخ 
والتعقيت»: 


وتمثل Jodl‏ لتحديات معالجة وتحليل البيانات الصغيرة الموسّعة والبيانات الكبيرة 
مجموعة جديدة من آليات إدارة المعلومات والتخزين (انظر الفصل الخامس) وتطوير 
أدوات تحليل البيانات الكبيرة. فمنذ بداية الحوسبة استمرت هذه الآليات والأدوات 
التحليلية الجديدة في التطور» وهي تقوم على اختبارات إحصائية: ونماذج» وأساليب تمثيل 
صوري رصينة متبعة» كما أنها تعمل على إنشاء أساليب وطرق جديدة تضرب جذورها 
في البحوث المتعلقة بالذكاء الاصطناعي والأنظمة الخبيرة التي هدفت إلى إنتاج تعليم 
الآلة بحيث مكنها حاسوبيًا وبصورة تلقائية التنقيب» والكشف عن الأنماطء slug‏ النماذج 
التنبئية. فمثل هذه الأدوات التحليلية أضحت ملائمة وبشكل مثالي في معالجة واستخلاص 
المعلومات من مجموعات بيانات ضخمة larg‏ بيعضهاء فقد أصحت تشغل حيزا 
uS‏ من الاستثمار في البحوث من أجل توسيع وإنتاج طرق معالجة جديدة للبيانات 
والخوارزميات الإحصائية والنمذجة وتقنيات التمثيل الصورية (المؤسسة الوطنية للعلوم 
(National Science Foundation 2012‏ وتسعى هذه الآدوات التحليلية. كما هي 
مطبّقة في مجال الأعمال التجارية والعلوم» للإجابة عن أربع مجموعات أساسية من 
الأستلة )2013 :(Minelli et al.‏ 


e‏ الوصف ISh (Description)‏ ومتى حدث ذلك الشيء؟ وكم مرة يحدث؟ 
e‏ التفسير ISU :(Explanation)‏ حدث ذلك؟ وما هو تأثيره؟ 
e‏ التنبؤ :(Prediction)‏ ماذا مكن أن يحدث بعد ذلك؟ وماذا لو فعلنا هذا أو ذاك؟ 


o‏ العلاج :(Prescription)‏ ما الحل أو النتيجة WA‏ وكيف مكن تحقيق ذلك؟ 
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آلبات تحليل السبانات 


وتس Ao‏ الإجابة عن هذه الأسثئلة من go jl‏ فئات رئيسة من UJ‏ التحليل: التنقيب عن 
البيانات والتعرّف على الأماطء التمثيل الصوري للبيانات وآليات التحليل ås padl‏ التحليل 
الإحصانيء والتنبؤ والمحاكاة والتحسين. وسيتم مناقشة كل من هذه الفئات باختصارء ولكن 
ينبغي تقديم dlo pa‏ ما قبل التحليل وتعلم gl åJ NI‏ لأنها مركزية لجميع الفئات الأربعة. 


ما يسبق التحليلات :(Pre-analytics)‏ 
تحتاج كل تحليلات البيانات إلى أن تكون البيانات المطلوب تحليلها معدّة سلفا للتحليل؛ معنى 

H.J. Miller (2010) and Han et al. (2011) وقد بن‎ dyu أنه قد جرى تجهيزها والتحقق‎ 

أربع عمليات فيما يتعلق بالبيانات ds all‏ والكبيرة والتي تطبّق عادة بالتسلسلء على الرغم من 

أنه لا يلزم تنفيذها بأي ترتيب معينء إضافة إلى إمكانية تكرار تنفيذها: 

e‏ اختيار البيانات :(Data selection)‏ تحديد مجموعة جزثية من المتغيرات الأكثر قيمة: 
وإطار العينة ال محتمل لهذه المتغيرات. حيث لن تكون كل المتتغرات الناتجة ذات 
أهمية. ولا بالضرورة كل نقاظ البيانات» فإدراج مثل هذه البيانات غير الضرورية في 
نماذج قد يولد التكرار وعدم الكفاءة. 

o‏ المعالحة TER‏ للسانات :(Data pre-processing)‏ تنظيف السانات ال مختارة لازالة 
الصو sl eL.‏ الأخطاء أو التحبّن أو التعامل مع الحقول المفقودة أو التناقضات وعدم 
السلامة.» وهيكلة البيانات لإدخالها في عملية التحليل. 

٠‏ اختزال السانات وإسقاطها :(Data reduction and projection)‏ التقليل من أبعاد 
اللسانات من خلال التحويلات de)‏ سبل JELI‏ التسوية والصقل (Smoothing)‏ 
وبناء السمات والخصائص» والتجميع» والتطبيع» والتسلسل الهرمي للمفهوم: والأساليب 
الإحصائية Jia‏ تحليل مستوى الانحدار وتحليل المكونات الرئيسية) لمكافأة تمثيل 
البيانات ولكن بصورة أكثر كفاءة. 

o‏ إثراء البيانات (Data enrichment)‏ دمج البيانات المختارة مع سانات أخرى (مثل 
بيانات التعداد السكانى وبيانات السوق) من أجل الوصول إلى رؤى يمكن الاستفادة منها 
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الفصل السادس 


فمن جهة» صمّمت كل خطوة من هذه الخطوات من أجل زيادة نوعية السانات 
المستخدمة ف التحليل» ومن جهة أخرىء باستثناء إثراء البيانات. من أجل تقليل حجم 
البيانات التي على التحليل التعامل معها. فالأول تم تصميمه لتعزيز صحة وصلاحية 
الاستنتاجات المستخلصة بالنظر إلى الفوضى الكامنة وعدم اليقين في البيانات الكبيرة (انظر 
Lail‏ التاسع)ء في حين يهدف الثاني إلى زيادة الكفاءة التشغيلية مع الأخذ بعين الاعتبار 
أحجام البيانات وسرعاتها والأحمال الحاسوبية. ومن ال ممكن أن يكون من الصعب القيام 
بهذه elall‏ عند إجراء التحليلات بشكل آني أو لحظيء وخاصة فيما يتعلق بتنظيف البيانات. 
ونتيجة لذلكء وفيما عدا التمثيل الصوري للمؤشرات» لا يجري تحليل البيانات الكبيرة LT‏ 
أو بشكل لحظي» ولكن يجري التحليل على سلاسل تمثل عينات كبيرة جذا لبيانات نظيفة: 
ومختزلة. ومخصّبة (ثرية) وخلال أزمان مختلفة. أما إذا كان المطلوب تحليلات بشكل I‏ 
أو لحظى» فتطبّق في العادة التحليلات المسبقة OLLU‏ مقدمًا على äus‏ من أجل تحديد 
طبيعة السانات وكيفية التعامل معها للانتقاءء والاختزال: والتنظضف على عجل. 

ويعد إثراء البيانات مهمة col‏ قيمة عالية لأنها تنتج أثرًا مَضخما Crampton et al.)‏ 
2012( تمكن من اكتساب رؤى لا مكن الحصول عليها من خلال قاعدة بيانات واحدة. 
وبحسب من تمت مناقشته في الفصل الثاني. فإن المبرر الرئيسي لإنشاء البنى التحتية 
للبيانات تمثل في إعادة استخدام البيانات. وإن التحدي يتمثل في إنشاء طرق لربط البيانات 
التي أنتجت لأغراض مختلفة بعضها «uso‏ والتى قد تختلف Laf‏ في البيانات الوصفية 
Lal‏ 4 لهاء ومعايير السيانات؛ ووحدات القياسء والإجراءات» والفئات» والنطاق» والتزامن؛ 
وتنسيقات الملفات» أو إنشاء طرق للربط لتقليل حدوث ال مغالطات ال محتملة الناتجة عن 
الاستدلال .(Creation of Potential Ecological Fallacies)‏ وهذه لست D yu dago‏ 
ولكن تعمل الأساليب الحاسوبية على جعلها أسهل من خلال استخدام الخوارزميات التى 
يمكنها البحثء Aio Ua LI‏ الدمج إعادة الجمع من خلال أنواع مختلفة من التحولات» وإعادة 
تهيئة البيانات. وبالنتيجة. يمكن التنقيب والتحليل قي مجموعة بيانات جديدة باستخدام 
الفئات الأربع الرئيسية للتحليلات التي سيجري نقاشها obal‏ 
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آلبات تحليل السبانات 


ويمكن أن تكون أعمال التحليلات المسبقة مملة باستغراقها وقنّا طويلا للغايةء ولكنها 
مع ذلك مهمة جدًا ولا يمكن تجاهلها. وبالنظر إلى الزيادة المنقطعة النظير في مختلف 
أنواع البنى التحتية الجديدة للبيانات والبيانات الكبيرة» فقد أصبحت منطقة ثرية للبحث 
حيث يسعى علماء البيانات إلى إيجاد طرق jl‏ إنتاجية وكفاءة وفعالية aly‏ وخصوصا 
أتمتة. هذا العمل. 


تعليم à) NI‏ أو :(Machine learning) ANI NEST‏ 
يمكن إجراء تحليل الأعداد الكبيرة جذا من سجلات البيانات في إطار زمني مناسب عن 
طريق الخوارزميات الحاسوبية. وفي حين أن الكثير من عمليات تحليل البيانات الكبيرة 
يمكن إجراؤها بالظرق نفسه المتبعة في تحليل البيانات الصغيرة: حيث يتخذ المحللون 
القرارات المتعلقة بالكيفية التي يتم فيها الاستكشاف من خلال هذه الخوارزميات» فإن 
الهدف من أغلب البحوث هو تطوير عمليات مؤتمتة مكنها e‏ السيانات والتعلم منها 
ومن تحليلها. ويطلق على هذه العمليات المؤتمتة مصطلح تعلم الآلة أو التعلم الآلي 
A‏ كل أحد فروع الذكاء الاصطناعي. ويهدف تعلم الآلة إلى التطوير المتكرر لفهم 
مجموعة البيانات؛ والتعلم التلقاني لإدراك JL el‏ معقدة gols slug å‏ توضح وتتوقع مثل 

هذه الأأماط؛ وتحسين النتائج )2011 (Han et al.‏ 


ويتكون تعلم الآلة بشكل عام من نوعين رئيسيين: مُراقب (باستخدام بيانات التدريب) 
وغير مراقب (باستخذام التنظيم الذاق). فى elad‏ المراقب» يقم تدريب نموذج لمطابقة 
المدخلات مع مخرجات معلومة. على سبيل JE‏ يمكن تدريب النموذج لمطابقة الرموز 
البريدية المكتوبة بخط اليد مع مثيلاتها المطبوعة (T‏ أو التنبؤ بنتائج معينةء فهي «مراقبة» 
معنى أن بيانات التدريب موجودة لتوجيه عملية التعلم )2009 (Hastie et al.‏ ف المقابلء 
تسعى نماذج التعلم غير الخاضعة للرقابة إلى تعليم نفسها على اكتشاف الأنماط وإيجاد هياكل 
البيانات دون استخدام بيانات التدريب. وبشكل «ele‏ يمكن تحقيق ذلك من خلال تحديد 
مجاميع وعلاقات بين البيانات التي لم يكن معروفا بينها مسبقا خصائص للتشابه أو الارتباط. 
فعلى سبيل «JU‏ يمكن أن يتعلم النموذج على كيفية تقسيم العملاء إلى مجموعات ذاتية 
متمائلة والتنبؤ بالمشتريات لتلك المجموعات )2011 .(Han etal.‏ فى WS‏ الحالتين» يتم 
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إنشاء نموذج من خلال عملية التعلم التي شكلتها القواعد والأوزان التي توجه كيفية بناء 
نموذج فيما (also‏ بالبيانات )2009 dlas l..39 .(Hastie et al.‏ بناء نموذج من slo‏ بسيط 
ذم يتم التعديل مرارا وتكرارا على ذلك البناء باستخدام قواعد التعلم بالمثل كما يطبق مع 
الطفرات «A aJ‏ إلى أن يتطور البناء إلى نموذج قوي )122 :2013 .(Siegel‏ وهناك شكلان 
للتعلم امراف وغير SERI‏ وهما التعلم شبه امراق الذي يشتمل على استخدام کل من 
التدريب والبيانات التي لا تحمل عناوين (وهي البيانات التي يمكن الحصول عليها بسهولة 
ولكنها غير مسماة كالصور والتسجيلات الصوتية: والفيديوء المقالات الإخباريهء وغيرها من 
البيانات الخالية من أي ملصقات تتيح التعرف عليها بشكل (SÍ‏ والتعلم النشط الذي يتيح 
للمستخدمين القيام بدور نشط في توجيه نموذج التعلم )2011 (Han et al.‏ 

وقد جرى استخذام التعلم VI‏ في جميع عمليات تحليلات البيانات الكبيرة go‏ 
على الرغم من أن هذه التحليلات ليست مقتصرة في عملها على هذه الطريقة. je‏ 
إجراؤهاء في كثير من الحالات. من قبل الباحث بشكل مباشرء وحتى ضمن التعلم AMI‏ 
sg 05939 Jil i‏ في الحكم على العملية وتوجيهها وتقييم النتائج الوسيطة. S;‏ 
لاحظ )2010( os H.J. Miller‏ التعلم JYI‏ ليس مجرد Ub ele‏ وسهل JULI‏ بل 
خی غير اجا $39 dà as‏ وهي امهارات التي لا يزال العقل البشري أفضل بها من 
أجهزة الحاسب الآلي. los‏ تم إحراز تقدّم كبير في تطوير تقنيات التعلم «JV‏ فإنه y‏ 
يزال من العلوم الناشئة التي مازالت بحاجة إلى الكثير من البحث لتحسين فعالية ومتانة 
النماذج المنتجة. 

وفيما «Jo‏ سيتم مناقشة كل dis‏ من فئات التحليلات الرئيسية على حدةء على الرغم 
من أنه تجدر الإشارة إلى أنها غالبًا ما تستخدم e‏ إلى جنب. على سبيل المثال» ينبغي أن 
يوفر التنقيب عن البيانات والتعرف على الأنماط أسس التنبؤ/التوقع أو التحسينء ويمكن 
استخدام الإحصاءات في التنقيب عن البيانات للكشف عن الأنماط أو في حساب التوقع/ 
التنبؤء وقد يستخدم التمثيل الصوري في التنقيب عن البيانات» أو لتحصيل المخرجات من 
أنظمة المحاكاة... إلخ. 
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التنقيب عن البيانات والتعرّف على الأنماط (Data Mining and Pattern Recognition)‏ 

التنقيب عن البيانات هي عملية استخلاص البيانات وأأماط من مجموعات البيانات 
الكبيرة )2011 .(Manyika et al.‏ ويقوم التنقيب عن البيانات على مفهوم امتلاك كل 
مجموعات البيانات الضخمه معلومات مفيدة ذات معنى على صورة غير ilg isc‏ وذات 
صلاحية سارية ا مفعولء وقابلة Alg U‏ 624325 ومفهومة في doly‏ مطاف Han et)‏ 
(al. 1‏ وبا لمثلء يستخده التعلم JYI‏ المراقب وغير المراقب للكشف والتصنيف 
والتقسيم عن العلاقات والارتباطات والاتجاهات ذات المغزى بين المتغيرات. وهي تقوم 
بذلك باستخدام سلسلة من التقنيات Le‏ في ذلك معالجة اللغات الطبيعية. والشبكات 
العصبية. وأشجار اتخاذ القرارء والأسالس الإحصائية (دون معاملات وذات المعاملات). 
وتختلف طريقة الاختيار بين نوع البيانات (المنظمة: وغير المنظمة» وشبه المنظمة) والهدف 
من هذا التَحللل)(انظر -Wadi‏ (( 


الجحدول رقم v)‏ -1( 
مهام وأساليب التنقيب عن البيانات 


التجزئة أو التجميع تحديد قانمة من المجموعات التحليل العنقودي (Cluster Analysis)‏ 
Segmentation or)‏ الضمنىة التي تصف السانات 
(Clustring‏ 





التصنيف (Classification)‏ التنبؤ باسم الفئة التي تنتمي تصنيف النظرية الافتراضة 
إليها مجموعة من البيانات 

استنادا إلى تعض مجموعات 

نيأناة aco jl‏ استقراء شجرة القرارات 


(Bayesian Classification) 


(Decision Tree Induction) 


aS JJI الشبكات العصبية‎ 


(Artificial Neural Networks) 


äi‏ دعم التمييز 





(Support Vector Machine) 
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الربط (Association)‏ إيجاد روابط بين كائنات قوانين الارتىاط 
البيانات؛ gal‏ بقيمة بعض 
الحقول بالاعتماد على قيمه 

حقول أخرى 


(Association Rules) 


تصنيف النظرية الافتراضية 
(Bayesian Classification)‏ 
الانحراف slz] (Deviation)‏ عناصر السانات التحليل العنقودي 
امعرضه للانحراف عن 
isst‏ 


(Cluster Analysis) 
كشف الانحراف‎ 
(Outlier Detection) 
تحليل التطور‎ 
(Evolution Analvsis) 
(Regression) الاتجاهات وامنحنيات التى الانحدار‎ (Trends) الاتحاهات‎ 

yasli‏ قواعد السانات» عادة 


عبر الزمن 


استخلاص تسلسل Ja:J1‏ 


(Sequence Pattern Extraction) 


التعميم (Generalization)‏ | دمج مواصفات البيانات القواعد والقوانين 9l!‏ 652 


(Summary Rules) 


( Attribute-Oriented Induction) 





(Miller and Han (2009: 7 المصدر:‎ 


إن معظم الآليات المدرجة في الجدول )6-1( تتصل بالبيانات المنظمة كتلك الموجودة في 


قواعد البيانات العلائقية. على سبيل JELI‏ من الممكن تطبيق نماذج التجزئة على قواعد بيانات 
عملاء التجزئة ومشترياتهم لتقسيمهم بحسب معرّفات مختلفة بالاعتماد على خصائصهم 
وأنماط سلوكهم من أجل تقديم عروض/ خدمات مختلفة لكل مجموعة مختلفة. وف تحليل 
الشبكات الاجتماعية» يمكن تحليل الروابط بين الأفراد لفهم المتغيرات الاجتماعية وكيفية تدفق 
المعلومات فيما بينهم. وفي كشف الارتباطات» يمكن استخدام مجموعة متنوعة من نماذج 
الانحدار في الكشف عن الروابط لحساب الاقترانات بين المتغيرات» ومن ثم الكشف عن الأنماط 
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الخفية التي يمكن الاستفادة منها لتحقيق مكاسب تجارية e)‏ سبيل «JULI‏ تحديد ما يتم 
شراؤه كوحدة من البضائع وإعادة تنظيم اممخزون لتعزيز الشرائية) (انظر الفصل السابع). 

وتثير البيانات غير ال منظمة» والتي تكون على شكل نصوص أو صور أو أصوات» تحديات 
خاصة فيما يتعلق بالتنقيب عن السيانات. OLG‏ معالجة اللغات الطبيعية تهدف إلى 
تحليل اللغة الإنسانية التي يجرى التعبير عنها من خلال الكلمة اممكتوبة وامنطوقة. وهي 
تستخدم دلالات وتصنيفات من أجل التعرّف على الأنماط واستخراج ال معلومات من الوثائق. 
وتشتمل الأمثلة على استخراج العنصر الذي يستخرج البيانات الوصفية من النص بصورة 
تلقائية من خلال البحث عن أنواع معينة من النصوص والتعابير. مثل أسماء الأشخاص 
والمواقع والتواريخ وال مصطلحات التخصصية والتراكيب المنطقية؛ واستخراج العلاقات التي 
تحدد تلقائيًا العلاقات بين العناصر الدلاليةء وربطها معا (على سبيل JELI‏ اسم الشخص 
وتاريخ میلاده أو مكانه. أو رأيه ببند (McCreary 2009) (L‏ ومن التطبيقات النموذجية 
مثل هذه الاليات التحليل الوجداني الذي يسعى إلى تحديد الطبيعة العامة للاراء وقوتها 
حول قضية ماء على سبيل JLI‏ ما يقوله الناس عن gahl‏ على وسائل التواصل الاجتماعي. 
كما مكن تعقب أماكن نشوء هذه الاراء باستخدام البيانات الوصفية الموضعية Graham)‏ 
(et al. 3‏ والتنقيب عن نشر المعلومات داخل وسائل التواصل الاجتماعيء: على سبيل 
JEL‏ تبادل عناوين المواقع الإلكترونية الأكثر تفضيلا ومشاركتها بين مختلف المستخدمين 
.(Ohlhorst 2013)‏ فهذه المعلومات مفيدة للشركات» مثل الوكالات gas ls AILENI‏ 3« 
والخدمات الماليةء والتى تسعى إلى الاستفادة من الاتجاهات الناشئة والوصول المنظم في 
الوقت المناسب (على سبيل «JULI‏ لوضع إعلانات تتناسب مع الأحداث الجارية؛ لبيع وشراء 
الأسهم قبل ردة الفعل العنيفة للسوق). 

أما الصور فيتم إنشاؤها للتخزين والعرضء وليس للمحتوى والبحث )2013 (Ohlhorst‏ 
فكشف وتصنيف واستخراج أنماط داخلهاء مثل التعرف على الوجه أو OK‏ ليس بالأمر 
السهلء ولكن يتم التعامل مع ذلك من خلال تقنيات المسح التصويريء والاستشعار عن 
تعد dadlsag‏ الضور وتقييات اتشان Liza «LJ MI‏ ذلك التغرقف على الأقياء ومطائقة 
القالب باستخدام مجموعات التدريبء وطرق التجميع» والشبكات العصبية. وتتفاقم 
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مشكلة التنقيب في الصور عند محاولة استخراج» ومقارنةء وفهرسة الأنماط لعدد Jóla‏ من 
الصور )2001 (Zhang et al.‏ وبرغم أن التنقيب في الصور لا يزال من المواضيع ALII‏ 
إلا أنه أصبح أكثر تقدمًا في السنوات الأخيرة. فعلى سبيل «JULI‏ فإن الموقع الإلكتروني 
على شبكة الإنترنت: (http://imagevision.com)‏ يدعي db‏ سيكون قادرا على تصنيف 
0 دقيقة من الفيديو في delal‏ الواحدة: لكل aol‏ وذلك باستخدام خوارزميات 
التعلم JYI‏ للكشف عن بعض الخصائص Jis‏ العري وشعارات الشركات. 

التمثيل الصوري للبيانات وآليات التحليل الصورية Data Visualisation and)‏ 
:(Visual Analytics‏ 


شاعت مقولة تنص على أن صورة واحدة تغني عن ألف كلمة. وبامثلء جرى استخدام 
ال جلات ال #الفووضف مجموغات Aa EM GLI‏ والرسوفات 
الإحصائية» والرسوم البيانيةء والخرائط. والرسوم المتحركة. وتكشف هذه الأساليب البصرية 
وتوصل على نحو فعال هيكل المتغيرات» وأنماطهاء واتجاهاتهاء والروابط بينها. وبالنظر إلى 
الحجم الهائل للبيانات الكبيرة وسرعتهاء فليس من المستغرب إذا أن التمثيل الصوري قد 
صار وسيلة شعبية لاستشعار البيانات وإيصال هذا الشعور. 


ويمكن استخدام التماثيل الصورية الناشئة ضمن عاط التقنية الرقمية للتنقل والاستعلاه 
عن البيانات» مما يتيح للمستخدمين الحصول على dole dab‏ عن كامل مجموعة البيانات. 
بالتركيز على البنود المهمة. واستبعاد البيانات غير ا مهمةء واختيار pais‏ بياني أو مجموعة 
من البيانات والحصول على مزيد من التفاصيل» وعرض العلاقات بين العناصرء واستخراج 
مجموعات فرعبية من التفاصيل عند الحاجة )1996 .(Shneiderman‏ وعند عمل ذلك. مكن 
الكشف عن خصائص وبنية مجموعات البيانات» وأكثر من ذلك مكن استخدامها لتوضيح 
وفهم النماذج ومجموعات البيانات المعقدة التي يتعذر تمثيلها بطريقة مجردة وواضحة 
ومفهومة (مثل الظواهر الذرية» والظواهر الفلكية الثلاثية الأبعاد)» ورسم عشرات الآلاف 
من نقاط البيانات للكشف عن البنية» والتجميعات» والثغرات» والقيم الشاذة التي قد تظل 
بدلا من ذلك مجهوله ف الخفاء )1996 (Shneiderman‏ على سبيل JUI‏ استيعاب وفهم 
ملايين التغريدات على شبكة التواصل الاجتماعي تويتر ليست بمهمة ila‏ فيمكن للمرء 
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الحصول على فكرة تقريبية عن القصص أو المواضيع التي تبدو els‏ ولكن الحصول على 
نظرة dole‏ وشامله هي daga‏ غاية في الصعوبة؛ وكيفيه تغير التوجه على مستوى الجماهير 
والأماكن. فأحد الحلول يتمثل في رسم خريطة تغريدات موزعة جغرافيًا ومصنفة بحسب 
ا ميول والأهواء. وهو نهج جرى الأخذ به من خلال فريق عمل الموقع الإلكتروني http://)‏ 
75 لقند أنشؤوا عشرات الخرائط حول توجهات امواضيع والتغريدات» 
واشتمل ذلك على الشكل ١(‏ -1) والذي يعرض التوزيع الجغرافي لتغريدات التخوف من 
ا مثليين في الولايات المتحدة من يونيو ۲۰۱۲ م وحتى إبريل ٠١١١‏ م. كما أنهم عرضوا 
محتوى موسوعة الويكيبيديا وجوجل بالنسبة لمواضع التوزيع الجغرافي حول العام. 

ويشيع استخدام التمثيل الصوري أيضا ليكون وسيلة للمراقبة الآنية ا لمستمرة لظاهرة 
ما بشكل آني أو لحظيء مما يتيح تعقب ورصد العديد من المتغيرات عبر الزمان واممكانء 
والمقارنة بينهاء وتحديد التغيير الحاصل. فلوحات التحكم والعرض (Dashboards)‏ 
للبيانات المتغيرة تكون غالبا معروضة على شاشات الحاسب JI‏ في غرف التحكم الحديثة 
وهي تلخص على نحو صوري الأنظمة المتغيرة باستمرار للمشغلين الآدميين» مع سلاسل 
زمنية ورسوم بيانية وخرائط للكشف عن الأحداث (انظر ليك 2013 Lake‏ للمقارنة بين 
dog! ٤‏ عرض). وعلى سبيل JELI‏ يمكن أن توفر البيانات من مختلف أنحاء نظام النقل 
خريطة لتدفق حركة ال مرور وتقارير الحوادث بشكل آني أو لحظي؛ أو مواقع الطائرات 
خلال مروزها غير منطقة ما'(انظر الشكل ۲- 1): كما قد توفر يانات رادار الظكّس خريطة 
لهطول الأمطار بشكل آني أو لحظي ومحاكاة للساعات القليلة الماضية. فمثل هذه البيانات 
الصورية لا تساعد ضباط إدارة حركة المرور والراصدين الجويين فقطء ولكن أيضا المواطنين 
الذين يمكنهم الوصول إليها ومتابعة الأوضاع الجارية باستخدام الحاسب الآلى أو الهواتف 
الذكية basg‏ سلوكهم لتجنب طرق معينة أو التعامل بشكل مناسب مع المستجدات. 
ومثال على £396 Joi‏ للوحة تحكم خاصة بمدينة dole‏ تضم مجموعة من البيانات SYI‏ 
أو اللحظية عن الطقس» وتلوّث الهواء» ومعوّقات حركة مرور النقل العام وتوافر الدراجات 
العامة» ومستوى ارتفاع ال منسوب الان النهريء وارتفاع الطلب على الطاقة الكهربائية 
وسوق الأوراق اطالية» واتجاهات التغريدات على شبكة التواصل الاجتماعي تويترء وتغذية 
كاميرات مراقبة حركة ال مرور تلك المعروضة ف الشكل Y)‏ 
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الشكل رقم q- ١(‏ 
التوزيع الجغرافي لتغريدات التخوف من المثليّة في الولايات المتحدة الأمريكية 
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الشكل رقم Y)‏ - 1( 
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مجموعة أدوات التحليلات الجغرافية الصورية التي وضعها المركز الوطني للتحليلات الصورية في 
جامعة ينكوبينج (Linköping University)‏ 
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ومن الممكن أيضا استخدام التمثيل الصوري كشكل من أشكال الاستنتاج التحلياى. 
وهناء لا يصف أو يعرض التمثيل الصوري مجرد البيانات فقطء ولكن يجري استخدامها 
أداة تحليلية. ويتم توجيه هذه الطريقة: والتي يطلق عليها مصطلح التحليلات الصورية. 
في الغالب بواسطة مجموعة من الأشخاص والخوارزميات التي تعمل باتساق لاستخراج 
البيانات» slug‏ النماذج البصرية وتفسيرهاء والمضي قدما في المزيد من التحليل الإحصائي 
(Keim et al. 2010)‏ لقد أصرحت آليات التحليل البصرية مجالا ها وجديدا من 
مجالات البحث» وهو الأمر الذي أسهم في تطوير حقل التمثيل الصوري للمعلومات من 
خلال دمج pole‏ التنقيب عن البيانات» وعلوم الإحصاء والإدراك Thomas and Cook)‏ 
6. فالعديد من أنواع الرسومات البصرية ال مختلفة شائع الاستخدام» وهي في العموم 
تفاعلية وتتيح للمستخدم التعامل معها والتلاعب في الصور من أجل البحث والكشف 
عن الأنتماط والروابط. وبالإضافة إلى ذلك. فإن الشاشات ال معروضة للمستخدم متصلة 
ببعضها في الغالب بحيث إن التفاعل مع إحداها ينعكس على الأخريات» مما مكن من 
تفخص جوانب من الببانات من أكثر من منظور واحد ق ذات الوقت. فعلى سبيل JELI‏ 
يعرض Kil‏ (1-6) أنواع SLT‏ التحليل الصورية المتاحة ضمن أدوات آليات التحليل 
الصوريه (GAV)‏ الموضوعة من قبل المركز الوطني للتحليلات الجغرافية الصورية في 
جامعة ينكوبينج (Linköping University)‏ في السويد. بالإضافة إلى توفيرها مجموعة 
مق a A e ra E‏ مون أذوات امجموعة من (des‏ السانات Js ais zal‏ 
تعاونيء وبناء التطبيقات» والتداخل مع تطبيقات الخرائط كخرائط جوجلء وبناء وتبادل 
القصص السردية. وينشئ الأخير تعدا اجتماعيا للأدوات» مما ES‏ الزملاء وغيرهم من 
Jal‏ تبراك حسنة متعلقة بالتمثيل الصوري (انظر الشكل ه - 5). 


التحليل (Statistical analysis) Lazy]‏ : 
هناك تاريخ طويل من الأساليب الإحصائية التي يجري تطبيقها على البيانات الكمية في 
محاولة لفهمها. فالإحصاء الوصفي يفصل خصائص وتوزيع نقاط البيانات ومستوياتها من 
الخطأ وعدم اليقين. ويشتمل الإحصاء الوصفي على تحليل السلاسل الزمنية التي تنص على 
كيفية تغيّر البيانات بمرور الزمن» ونظرية الرسم البياني التي تدرس بشكل رياضي تنظيم 
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هياكل الشبكة: والإحصاء (ll‏ الذي يصف هندسة وأنماط التجميع» والتشتتء والانتشار 
في حين يسعى الإحصاء الاستدلالي إلى شرح» وليس مجرد وصف» الأنماط والعلاقات التي 
قد توجد داخل مجموعة البيانات» واختبار قوة وأهمية الارتباطات بين المتغيرات. كما 
يشمل الإحصاء البارامتري (المعلمي) الذي يجري استخدامه لتقييم الفرضيات باستخدام 
بيانات الفاصل الزمني وبيانات مستوى النسبة» مثل الارتباط والانحدار؛ والإحصاءات غير 
المعلمية المستخدمة لاختبار الفرضيات باستخدام بيانات المستوى الاسمية أو الترتيبية؛ 
والإحصاءات الاحتمالية التي تحدّد احتمال حدوث حالة ماء مثل تحليل النظرية الافتراضية 
(Bayesian)‏ ويجري تطبيق تقنيات الإحصاء الوصفي والاستدلالي التي تستخدم تقليددا 
في تحليل البيانات الصغيرة في البيانات الكبيرة أيضاء وكما جرى نقاشها في الفصل التاسع 
فإن هذا ليس سهلا على الدوام لأن الكثير من هذه التقنيات جرى وضعها لرسم رؤى من 
البيانات الشحيحة وليست المتوافرة بشكل فائض. ومع «lS‏ توفر هذه التقثيات وسائل 
للاستفادة من كميات البيانات الهائلة» كما يضمن حجم البيانات الهائل إمكانية تجزئتها إلى 
مجموعات بطرق عديدة دون أن تصبح صغيرة lae‏ مما لا مكن معه حساب الاختلافات 
بين مجموعتي الضبط وامعالجة بصورة ذات معنى. وتستخدم الإحصاءات بشكل روتيني 
في المساعدة على التنقيب عن البيانات والتنبؤ بها وتحسينها (انظر الجدول (T - ١‏ 


التوقع والمحاكاة والتحسين :(Prediction, SimulationandOptimisation)‏ 

هناك طريقة أساسية في الحصول على القيمة من البيانات وهي استخدامها لمحاولة 
معرفة أو توقع ما سيحدث في ظل ظروف مختلفة. على سبيل JELI‏ قد ترغب شركة ما في 
توقع ردود أفعال العملاء تجاه منتج معين أو حملة ماء أو قد تحتاج الحكومة المحلية إلى 
محاولة التنبؤ بكيفية عمل البنى التحتية للنقل إذا جرى إغلاق عنصر مهم ذو حساسية» أو 
قد يسعى العلماء إلى التنبؤ موعد احتمال حدوث انهيار أرضي وتحت أية ظروف. إن مثل 
هذه ال معلومات مفيدة جدا للمنظمات من حيث تمكينها من التخطيط لحالات الطوارئ 
المختلفة. وللشركات من حيث إنتاج Sl‏ لزيادة نمو الأرباح (انظر الفصل السابع). وفي 
جميع الحالات» ثُبنى النماذج باستخدام المعرفة القائمة سلفا عن كيفية عمل النظام» والتي 
تعالج البيانات لتقدير النتائج ال محتملة في ظل سيناريوهات مختلفة. وكما ف التنقيب عن 
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البيانات. هناك العديد من الطرق المختلفة التي مكن استخدامها لإنتاج النماذج التنبئية. 
JS s‏ منها نقاط قوتها وضعفهاء وهي تنتج تنبؤات أقل خطأ أو أكثر دقة بالاعتماد على 
نوع ا مشكلة والبيانات )2010 (Seni and Elder‏ ومع US‏ من الصعب الحكم aa‏ 
على أن أي نوع من النماذج» وإصداراته ال مختلفة. سيعمل بشكل أفضل على l‏ مجموعة 
بيانات ممُعطاة. وقد تمثل الحل oiy‏ المسألة في استخدام نهج مركب يستفيد من الكمية 
الهائلة من الطاقة الحاسوية المتاحة للمحللين الان )2013 (Siegel‏ فڪوضا عن jx‏ 
نهج واحد وبناء عدد قليل من النماذج» فالنهج المركب يبني نماذج متعددة باستخدام 
مجموعة متنوعة من التقنيات للتنبؤ بالظاهرة نفسها. وبعد ذلك» بدلا من تحديد النتائج 
(التقديرات) من النموذج الأفضل «lal‏ يجري العمل على الجمع بين التقديرات من جميع 
النماذج لإنتاج إجابة واحدة شاملة. ويؤدي تجميع النتائج إلى E eu‏ قوة € كما تعوض 
العملية نقاط الضعف ف كل نموذج. على سبيل JELI‏ قد يبني نهجا مركا لتؤقع سلوك 
العملاء سلسلة من ZOL‏ الانحدارء والشبكات العصبية»ء والجار الأقرب: وشجرة القرارات. 
فكل نموذج قد يكون أفضل من غيره في التنبؤ بأنواع معينة من المستهلكين» ولكن هكن 
تقليل الفروقات من خلال الجمع بين مخرجات gigal‏ مما يزيد التنبؤ قوة Franks)‏ 
Siegel 2013‏ ;2012). فباستخدام طريقة تضم العديد من النماذج ال منسجمة مكن تطبيق 
المئات من الخوارزميات المختلفة على مجموعة بيانات» ومن ثم ضمان إنتاج أفضل نموذج 
تنبؤي ممكن. 

فالمحاكاة هي عبارة عن نماذج تسعى إلى نمذجة العمليات والأنظمة في العام الحقيقي. 
والهدف من ذلك هو تحديد LAS‏ عمل نظام ما وكيفية سلوكه وفقا لسيناريوهات مختلفة, 
وتقييم أدائها Las‏ بهدف تحسن كفاءتها وفعاليتها )2003 .(Robinson‏ ومن الأمثلة 
الشعبية لعبة الحاسب الآلي سيم سيتي (SimCity)‏ التي تحاي كيف يكن ممدينة أن تنمو 
وتتطور في ظل ظروف يختارها اللاعبون» قائمة على أساس النموذج الكامن وراء العمليات 
المدنية المعروفة. وبالمثلء تستند توقعات الطقس على محاكاة LASI‏ تطور الطقس بالنظر 
إلى الظروف السائدة والمعرفة العلمية. وهناك العديد من الأنواع ا مختلفة لنماذج المحاكاة. 
والتى استفاد كثير منها من التعلم SI‏ من أجل تحسين عمل النموذج بشكل jab‏ 
والتعامل مع الخصائص الناشئة مثل الأحداث غير المتوقعة. إن نموذج سيم سيتي هو 
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نموذج قائم على التوكيل )2007 (Agent-based) (Batty‏ ويتكون هذا النموذج من Áo‏ 
تمكن من تعيين خصائص معينة للميزات الفردية فيها مثل المباني والطرق. ويتم تعيين 
خصائص هذه البيئة بواسطة Wg‏ وعند تشغيل النموذج» يسعى الوكلاء إلى حل مهمة le‏ 
والتفاعل مع البيئة وغيرهم من الوكلاء الاخرين بالاعتماد على خصائصهم المسندة إليهم. 
وبالمحصّلة. عند قيام الوكلاء pela‏ يقومون بتغيير البيئة» وهي في هذه الحالة المدينة 
التي يسكنونهاء وإنتاج نظام معقد ومتغير. ومن ثم فإن النظام يعمل من أسفل إلى «Ael‏ 
مع أنماط مكانية وزمانية تتغيّر من تفاعلات الوكلاء الفردية مع البيئة. وتستخدم مثل هذه 
النماذج محاكاة القضايا المدنية خارج الألعاب لنمذجة استخدام الأراضي وتخطيط النقل 
ووضع خطط الطوارئ للكوارث )2007 (Batty‏ 


ويهتم التحسين بتحديد الإجراء الأمثل لتحسين الأداء (عادة من خلال خفض التكلفة 
أو زيادة العائد أو المخرجات). ويمكن حساب التحسين باستخدام وتقييم نماذج التنبؤ 
والمحاكاة. أو تطويرها من خلال أنواع أخرى من الخوارزميات أو الاختبار الإحصائى. فعلى 
سبيل JEL‏ تستخدم الخوارزميات الجينية. وهو نوع معين من التعلم الآلي: الأفكار 
امنتقاة من الطبيعة. مثل Dhol‏ والطفرات. والاختيار والتهجين. gög)‏ وتطوير حلول 
ممكنة لمشكلة ما )1996 (Mitchell‏ كما يسعى ele‏ الشبكات العصبية» وهو نهج آخر 
مستوحى بيولوجياء ممحاكاة كيفية عمل الدماغ البشري. باستخدام عناصر المعالجة العالية 
الترابط لحساب وتقييم وحل مشكلة ما )2000 .(Picton‏ كما يمكن استخدام اختبار coll‏ 
(A/B Testing)‏ بشكل دوري ouii‏ وتطويع نظام cho‏ من خلال مقارنه مجموعة ضوابط 
مع مجموعات اختبار مختلفة من أجل تحديد العلاجات (على سبيل JELI‏ النصوص. 
والتصاميم» والصورء والألوان اللمستخدمة على موقع إلكتروني على الإنترنت) لتحسين هدف 
معين (Ae)‏ سبيل JELI‏ معدلات التبرع). 


الخلاصة: 
كان الهدف من هذا الفضل تقديم dole dox‏ عن مجموعة من الآليات الناشئة وتحليلات 


البيانات التي يتم استخدامها لمعالجة وتحليل وتطبيق البيانات الصغيرة الموسعة والبيانات 
الكبيرة. لقد تم نبذ مثل هذه الأساليب لعدد من السنوات» ولكنها أصبحت أكثر انتشارا 
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ويمكن الوصول إليها مع تطورها ونضجهاء وتوفر المعالجة الحاسوبية المطلوبة لتصبح متاحة 
على نطاق أوسع. ومع «US‏ يطرح حجم وسرعة البيانات الكبيرة تحديات جدية OUS‏ 
التحليل وما قبلها بسبب عدم تصميم العديد من هذه الاليات التقليدية والخوارزميات 
لتتناسب مع HLI‏ من ال ملاحظات. أو لتتعامل مع مجموعات بيانات سريعة التغير 
.(Batty et al. 2012)‏ ومن ثم فمن الواضح أن هناك حاجة إلى مزيد من البحوث 
لتكييف. وصقل وتوسيع الآليات الحالية وابتكار أساليب جديدة يمكن لها إضفاء معنى من 
البيانات الكبيرة والبنى التحتية للبيانات واستخلاص القيمة منها. وعلاوة على eUS‏ أضحت 
الأجيال الجديدة والقديمة من العلماء ومحللى الأعمال. على حد سواء» بحاجة إلى التعرف 
على مصادر البيانات الجديدة وخصائصهاء وأن تتعلم مجموعة جديدة من المهارات إذا 
كانت تريد أن تكون قادرة على الدراسة والاستفادة من رؤى وأفكار طوفان البيانات «e3UJI‏ 
متضمنا ذلك معالجة البيانات المنظمة والبينات غير المنظمة» والترميز الأساسي» والتنقيب في 
البيانات» والتمثيل الصوريء والنمذجة. وال محاكاة (انظر الفصل التاسع). 

إن هذه التحديات لا تقوم على مجرد أسس تقنية أو موارد بشرية. فإن آليات التحليل 
تعد انعكاسًا لطريقة معينة في الرؤية والاستشعار للعام المحيط؛ فهي مظهر من مظاهر 
المعرفة الخاصة. وكما نوقش ف الفصل الثامن» تثير البيانات الصغيرة الموسعة والبيانات 
الكبيرة وآليات التحليل المرتبطة بها تساؤلات جوهرية بشأن تنظيم وممارسات العلوم 
(Floridi 2012)‏ مع العديد من المقترحات التي توحي بالدخول في نموذج علمي جديد. 
ونتيجة UI‏ لا يتطلب التصدي لطوفان البيانات مجرد SS‏ جديد حول طرق التحليلء 
ولكن تفكيراً Glia‏ فيما يتعلق بفلسفة العلوم )2012 (Leonelli‏ ويستدعي جزء كبير من 
هذه المهمة التفكير النقدي ف التأطير الواسع للتحليلات وآليات الطرق وال مناهج المحددة. 
والتفكير في كيفية إنتاج آليات التحليل الجديدة أنواعا معينة من المعارف والرؤى للعام 
المحيط بناء ومن ثم العمل على معرفة عمل هذه المعارف الجديدة ف els]‏ متضمنا 
ذلك نمذجة كل الأشياء JI‏ | تر إليها )2013 ‘Beer and Burrows 2013; Ruppert‏ 
انظر الفصل الحادي عشر). وبعبارة أخرى. هنالك حاجة ملحة وبصورة عاجلة للبحوث 
الفنية والفلسفية فيما يتعلق بآليات التحليل الناشئة من أجل استشعار البيانات ال موسّعة 
والبيانات الكبيرة. 
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المبررات الحكومية والتجارية للبيانات الكبيرة 


(The Governmental and Business Rationale for Big Data) 


لم تتكشف ثورة البيانات دون فكر وبطريقة مجهولة» LSS‏ هو حال الثورات $559« 
جرى الدفع بها بسبب مجموعة قوية من الحجج:ء والتمهيد لها من قبل مجموعة من 
ا متحمسين المؤمنين بفوائد الطرق الجديدة للمعرفة والتعامل في هذا العالم وتحالف 
أصحاب المصالح الخاصة الذين يجنون الأرباح من ظهورها. وف حين أن الحجج التي 
اشتخد ت ان 955 وة جداء وغالمًا ماا تدعا و ات :اة إلا أنها 
تشكل ف مجموعها ما أطلق عليه )1977( Foucault‏ مصطلح نظام الخطابة وا مجادلة. 
أي مجموعة من النقاشات المتداخلة التي تبرّر وتغذي التطورات الجديدة وتعمل على 
تطبيعها واستنساخها وإعادة استخدامها. فهذا النظام الخطابي يقدم الأساس المنطقي 
لتبني الأفكار والتقنيات الجديدةء وإضفاء الشرعية على مساعي تطويرها Jwg‏ تنفيذها. 
وتدعو النقاشات المستخدمة ف النظام إلى الترويج لرسالتهم وجعلها قناعة dale‏ لترغيب 
الناس والمؤسسات باعتناق منطقهم. وإلى الاعتقاد والعمل فيما يتعلق بهذا المنطق 
.(Dodge and Kitchin 2005)‏ كما عملت على إنتاج أجواء معينة يتم من خلالها 
"تغذية plo‏ خاصة من الفكر والممارسة بحيث تبدو طبيعية ومرغويًا فيها" Amin and)‏ 
«(Thrift 2013: 5‏ وهى تغرس نوعًا Lol‏ من الاستجابة العاطفية )2009 (Anderson‏ 
فمثل هذه الخطابات والأجواء سعت إلى إعادة صياغة العام وفق رؤية dols‏ وإعادة 
تشكيل "القضاياء الفاعلينء المخاطرء المصالح» والرغبات التي تنتشر في الحقل السيامي 
وامشهد الاقتصادي )4 :2013 (Barnett‏ 

وكما 3« النقاش في الفصلين الثاني والثالث» فقد سعت نظم الجدال والمحاورة المتداخلة 
إلى الدفع بعمليات تطوير البنى التحتية للبيانات والبيانات ال مفتوحة مستخدمة النقاشات 
واطداولات حول Jols‏ ومشاركة السانات. واستنساخها وإعادة استخدامهاء وحرية النفاذ 
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والوصول dy!‏ والحكومة ال مفتوحة. والشفافية. وا مساءلة؛ وتنظيم المشاريع الاجتماعية؛ 
واقتصاديات السعة ووفورات حجم الإنتاج. وكما تم بيانه في هذه الحالات» فإن منحى 
النقاش وطريقة التداول قد تكون مدفوعة من قبل مجموعة من الأطراف المعنية التي قد 
تستخدم الحجج نفسها ولكن لتحقيق مرام مختلفة ule)‏ سبيل المثالء تستخدم منظمات 
المجتمع (3l‏ وقطاعات الأعمال الكبيرة خطابات الشفافية والمساءلة لإتاحة بيانات الحكومة 
وفتحهاء ولكن أحدهما لأسباب مدنية والأخرى للانتفاع JU.‏ من السانات). hY‏ 
الخطابية ]15 لم تكن Das‏ نتاجًا فوقيًا من الدول أو الأعمالء ولكنها انتشرت Cai ug‏ من 
خلال العديد من القنوات الأصغر .(Foucault 1977, 1978) lea‏ وقد جرى قبولها دون 
إشكالية من قبل الجماهير» من ال مواطنين والمؤسسات الذين كان من السهل استمالتهم 
من خلال منطقهم. وبالأحرىء» فإن الخطابات مفتوحة للتحديء والرد عليهاء ومقاومتهاء 
وتفنيدهاء ومخالفتهاء والتصدي لهاء وإظهار عوارهاء وتقديم رؤى بديلة جديدة: وفي كلتا 
الحالتين» يستند المروّجون أو المعارضون لرؤى جديدة على السجل الزمني الممتد من الماضي: 
إلى الحاضرء وحتى ال مستقبل لدعم حججهم» وذلك باستخدام الأدلة والشواهد من جولات 
سابقة من التغير الاجتماعي والاقتصاديء إلى جانب التحديات الحاضرةء والتكهنات حول 
الكيفية التي يمكن أن تش كل الكيفية التي ستكون عليها الأمور خلال سنوات قادمة: في 
ظل سيناريوهات مختلفة. )2012 ,2011 (Kinsley‏ ومن «e‏ جرى تداول المشهد alas)!‏ 
عبر جولات من التفاوض باسم الصراع على الأفكار والسبل لهيكلة وتمثيل وعمل وتنظيم 
المجتمعات. في الحاضر وال مستقبل. 

وقي هذا الفصلء سيجري دراسة col, xl‏ ال منطقية للبيانات الكبيرة للجهات الحكومية 
وقطاع الأعمال. وقد تم تنظيم النقاش حول أنماط خاصة من النظم والأنشطة الاجتماعية 
بدلا من تنظيم Lail‏ بحسب مختلف الخطابات التي يشيع توظيفها للترويج لإشاعة 
اعتماد البيانات الكبيرة على سبيل JUI‏ التبصّر والحكمة:. الإنتاجية» القدرة التنافسية: 
الكفاءة. الفعالية. الفائدة. «dal LN‏ والتوريق ال مالي .(Securitization)‏ فالخطب 
تمتلك تأثيرها الأقوى عندما يجري تعبئتها وتوجيهها في مهام وقضايا duso‏ والمثير في 
حالة البيانات الكبيرة هو ان جدالها تد إلى جميع القطاعات والشرائح - الاجتماعية. 
والسياسية» والاقتصادية» والبيئية؛ فهي واعدة من خلال تقدهها وسائل جديدة LS‏ في فهم 
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وإدارة جميع جوانب حياة الإنسان. وهناء سيتم مناقشة هذا الوعد فيما يتعلق بأربع 
مهام رئيسية هي: حكم الناس وتنظيمهم» وإدارة ا منظمات: وتعزيز القيمة وإنتاج رأس 
ا ماله وأخيرا إنشاء أماكن أفضل. وهذه مهام توضيحية فقطء على سبيل الحصر وليست 
شاملة» حيث إن هناك العديد من التطبيقات الأخرى الممكنةء Le‏ في ذلك القضايا البيئية 
(انظر Mayer-Schonberger and Cukier 2013; Siegel 2013; Smolan and Erwitt‏ 
2012(. وستتم مناقشة كيفية إعادة تشكيل البيانات الكبيرة للبحوث في Lail‏ التاليء كما 
سيجري مناقشة الدعوات ال مضادة لتطبيق البيانات الكبيرة في الفصل العاشر. 


(Governing People) الشعب وتنظيمه‎ eS 
التنوير سعت,الدولة لإنشاء‎ pas الدولة هى مولدٌ ومستخدم رئيس للبيانات» فمنذ‎ 
طرق أكثر منهجية. من جهةء لإدارة وحكم المجاميع السكانية: ومن ناحية $59« لتقديم‎ 
هذه‎ elol الخدمات للمواطنين. فإحدى هذه الطرق الرئيسية التى هدفت من خلالها إلى‎ 
الأدوار بكفاءة وفعالية كانت من خلال التدقيق والتقدير الكمي والنوعي للمجتمع - أي‎ 
بناء معرفة مفصلة لإنفاذ ولايتها القضائية والاختصاصية من خلال تطوير النظم الإدارية‎ 
على نطاق واسع» بدعم من أجهزة فنية وتقنية متنوعةء تعمل على قياس وتتبّع فهرسة‎ 
Alonso and وتمسيز السانات عن الأفراد. والشركات» واممؤسسات» وال مكونات الأخرى (انظر‎ 
Starr 1987; Barnes and Hannah 2001; Desrosiéres 1998; Kitchin and Dodge 
وإدارةء وتخزين» وتحليل البيانات من المهام الرئيسية‎ «e 3l إن‎ (2011; Porter 1995 
في جميع مؤسسات الدولة. فهي تستخدم في تقييم الالتزامات والاستحقاقات للموضوعات‎ 
والتهرب»‎ «JUS! السيادية وغير السيادية»ء والكشف والمراقبة عن الخروقات وعدم‎ 
فعلى‎ .(Rose 1996) والالتزامات القانونية ال ملعمول بها‎ lekbl فيما يتعلق‎ «oz sls 
dle lg يتم في الدوائر الحكومية. وخاصة تلك المتعلقة بالتمويل والتجارة‎ «JULI سبيل‎ 
الاجتماعيةء تحديد جميع اللمواطنين والكيانات وتتبعهم» ورصد القضايا والاتجاهات من‎ 
خلال التحديثات على سجلاتهم» وتعيين ملفاتهم التعريفية وربط بياناتها بهم» وتعقب‎ 
المدفوعات. وإدارة انضباطهم والخدمات المقدمة لهم. أما في المدارسء فيؤخذ التسجيل‎ 
لبياناتهم» واحتساب وتقييد الدورات الدراسية وعلامات الاختبارات» ويتمٌ مكافأة الطلاب‎ 
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ومعاقبتهم وفقا لأدائهم وسلوكهم. وف قطاع الصحةء يتم قياس حالة ا مريضء وتسجيلها 
والعمل على أساسهاء واحتساب وتقييم أداء المرافق الصحية. كما تعنى وكالات حكومية 
متخصصة أخرى بإنتاج وإدارة وتحليل ونشر البيانات التي لها بالغ الأثر في إفادة العمل 
الحكومي. على سبيل ال مثال» الوكالات الإحصائيةء وهيئات المسح ورسم الخرائط الجغرافية: 
وأجهزة الاستخبارات التي تتعهد ببرامج مستمرة لإنتاج البيانات من خلال أنظمة قياس 
مثل المسح والمراقبة. 


ولتعزيز ممارساتها الحسابية» سعت Jol‏ من daz‏ لتبرير وترشيد نظمها وعملياتها 
على الموضوعات» ومن جهة أخرىء لتطبيق وسائل إدارية أكثر تعقيدًا وتفصيلا من أي 
وقت مضى )2001 .(McNay 1994; Miller‏ فالمسعى الأول يشمل الخطابات حول 
الحكومة الفعالة والقيمة مقابل JUI‏ والمواطنة والتمكينء والعدالة ومكافحة vg yo]‏ 
والأمن والسلامة» والتي تتماشى مع فكرة تناول المشاكل والقضايا العامة من خلال المنطق 
الجماعي والمبادئ المشتركة. وتجابه هذه الخطابات من قبل أولئك الذين لديهم الرغبة في 
تقليل مستوى رقابة الدولة وسلصطتها مقابل الحريات الشخصية. والرقابة والضبط للنظم 
ا مجتمعية والاقتصادية» أو أن تكون أكثر انفتاحا واستجابة وإنتاجية في ال ممارسات الحكومية 
متضمناً ذلك إتاحة البيانات التي يحملونها بشكل أكبر وأكثر حرية (انظر الفصل الثالث). 

Ul‏ المسعى الثاني فيتضمن Las‏ أنظمة وتقنيات وبنى تحتية مصممة gazd‏ ومعالجة 
البيانات على نحو فعال وأكثر تطورًا من أي وقت مضىء متضمنا ذلك الأنظمة الأكثر ثبانًا وقدرة 
في التعريف والتحديد (التواقيع والصور وبصمات الأصابع» وأرقام الضمان الاجتماعي وجواز 
السفرء وقوانين الضرائب» وأرقام الترخيص والحسابات» وال معلومات البيومترية» والمستخدمين 
وكلمات السر والرموز البريدية... إلخ)» والتي يمكن تشغيلها على نحو متزامن بشكل متزايد 
وعن بعد )2005 «adeg (Dodge and Kitchin‏ يؤكد )178 :1997( Hannah‏ على أن أحد 
أشكال الحاكمية الأكثر فعالية يكون ف الغالب من خلال تكوين "لفيف معقد من مجموعة 
بسط النفوذ والهيمنة...من خلال التعدادات والبيروقراطية والسياسات. وما إلى ذلك وكم 
Jila‏ من ال مؤسسات التخصصية مثل المدارس وأماكن العمل والأراضي الممتدة المجهولة المثبتة 
ملايين من نقاط الانطلاق كأجهزة الصراف الآلي: وكاميرات المراقبةء ونماذج تعبئة الطلب". 
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ولذاء فإن البيانات الكبيرة بأحد معانيها ليست شيئا جديدًا على الدول - وهي التي 
تعاملت ونلا مع كميات déla‏ من البيانات ف إدارة الاختصاصات القضائية والقانونية: 
كجزء جرى معالجته واتخاذ الإجراءات المتعلقة به ف الوقت ا مناسب ف حينه أو قريبًا منه 
كلما تفاعلت الوكالات مع الموضوعات. ومع ذلكء ينظر إلى البيانات الكبيرة باعتبارها أحدث 
مجموعة من التقنيات التي يمكنها توسيع وتحسين عمل الدول من خلال زيادة الانضباطية 
والشمولية للممارسات الحسابية لأعمالها. كما يتبنى البائعون» في بعض الحالات. خطاب 
الدفع بحلول البيانات الكبيرة بهدف بيع خدمات الدولةء وفي حالات أخرىء تأخذ الدولة 
بزمام المبادرة بشكل نشط. وق الوقت الحاضرء هناك نوعان من الإستراتيجيات الخطابية 
الرئيسية ال مستخدمة لتشجيع استخدام البيانات الكبيرة في السلطات الاختصاصية»ء يتعلق 
النوع الأول بالتحسينات على الإدارة العامة وتقليل التكاليف من خلال تعزيز الكفاءة 
التشغيلية: وتقليل تكلفة الأخطاء والاحتيال في إدارة المنافع» وزيادة في الإيرادات الضريبية 
عن طريق تضييق الفجوة الضريبية... وتحسين تخصيص التمويل ف البرامج والخدمات ذات 
الجودة الأعلى» وزيادة المساءلة في القطاع العام: وإطلاع أفضل للمواطنين", مع تقديرات 
مقترحة بعائدات لحلول البيانات الكبيرة من الكفاءة التشغيلية المتعلقة بإدارة القطاع العام 
à‏ القارة الأوروبية تعادل مئة وخمسين مليار دولار Manyika et al. 2011: 61,) Kyl‏ 
62(. وسيجري لاحقا مناقشة هذه الحجج بشكل xS]‏ فيما يتعلق بإدارة المنظمات وصنع 
أماكن أفضل. 

ويهتم النوع الثاني بأمن الدولة ومكافحة الجرهة» إذ تقوم جميع الدول بالمراقبة 
والرصد لأغراض الأمن والسلامة ومنع الجريمة والاعتقال من خلال أجهزة الشرطة وجمع 
المعلومات الاستخباراتية على نطاق أوسع. وقد تم تطوير الكيفية التي تنفذ بها هذه 
الأنشطة ما يتماشى مع التقنيات الجديدة - كالتنصت على ال مكالل مات الهاتفية واعتراض 
الموجات الراديوية» والدوائر التلفزيونية المغلقة. والتصوير الجوي» وصور الأقمار الصناعية, 
ومراقبة الإنترنت - والتي كثيراً ما جرى التبرير لها عند وقوع أحداث رئيسية مثل الحرب 
الباردةء والحوادث الإرهابية )2001 (Innes‏ وف الآونة الأخيرة. قذمت أحداث الحادي 
عشر من سبتمبر وما تبعها من الحرب على الإرهاب المبرر ا منطقي لتغيير جذري في عمليات 
المراقبة والتأمين التي تقودها الدولة على نطاق واسع )2006 .(Amoore‏ وكان Ule‏ لبعض 
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الوقت أن تحليلات البيانات الكبيرة كانت عنصرًا أساسَيا في تحسين هذه الأنشطة. وخاصة 
فبما يتعلق döl e‏ الحدود وفحص الهيحرة Kitchin and Dodge 2006; Clements)‏ 
2013(. وقد كشفت تسريبات يونيو 2013 بشأن برنامج وكالة الأمن القومي الأمريي 
بريزم (PRISM)‏ المدى الذي وصلت إليه ممارسات مراقبة البيانات» وممارسات البيانات 
الكبيرةء والاليات التحليلية المستخدمة لجمع ومعالجة البيانات المتعلقة بالاتصالات اليومية 
لجميع المواطنين مثل المكامات اليومية» الرسائل النصيةء رسائل البريد الإلكتروني» واستخدام 
الإنترنت»ء بدلا من اقتصارها على المواطنين الأجانب والقوى الخارجية أو لأهداف محددة 
.(Greenwald and MacAskill 2013; Risen and Lichtblau 2013)‏ فهذه التسريبات 
كانت هي الأحدث في سلسلة الكشف عن تجسس الولايات المتحدة على مواطنيها بشكل 
Bamford 2009) „à>‏ ; 2007 50107). والواقع» أن من الواضح أن الوكالات الاستخبارتية, 
وامتعاقدين العسكريين-الصناعيين» هم في طليعة مطوري الجيل القادم من أدوات السيانات 
الكبيرة لإدراك الكميات الهائلة من البيانات عالية السرعة. وقد استثمرت بكثافة في slo‏ 
الكفاءات والتقنيات واطرافق على سبيل «JULI‏ جرى استثمار 1.7 مليار دولار آمریک في 
مركز البيانات القائم في يوتا معالجة وتخزين البيانات الكبيرة التي تم جمعها من الولايات 
(Carroll 2013)‏ وبينما تسعى الدول إلى ترشيد تلك المراقبه ذات النطاق الواسع على 
مواطنيها من خلال الخطابات العامة الموجهة للأمن والسلامة. فإن الحقيقة المائلة هي 
أنها قد طوعت الكثير من أجهزتها سرا لتنفيذها ودون اتباع للإجراءات القانونية الواجب 
العمل بها مما يقوض اطثل العليا للدمقراطية القانئمة على الشفافية والثقة Clements)‏ 
2013(. ومع ذلك» فمن غير المرجح على المدى القصير أن يقوم الغضب الشعبي العارم على 
هذه ال ممارسات والتجاهل الصارخ للحقوق الأساسية مثل الخصوصية: على إبطاء أو إعادة 
تشكيل طريقة التعامل مع البيانات الكبيرة في هذا الجانب من الحكم» ولا لثني الخطابات 
التي استخدمت لتبريرها. 
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:(Managing Organisations) ادارة المنظمات‎ 

تماما كما تغيرت الدول وتفرعاتها الكثيرة في الحكم كالإدارات. السلطات المحلية: 
الوكالات» الجيش» مقدمي الرعاية الصحية... إلخ مع مرور الوقت» واعتمادها ممارسات 
وتقنيات إدارية جديدة لإعادة تشكيل الكيفية التي يجري بها تنظيمها وتشغيلهاء «Jib‏ 
قامت شركات الأعمال والكيانات المؤسسية الأخرىء مثل ال منظمات غر الحكومية والهيئات 
التطوعية وا مجتمعية: والجمعيات الخيريةء والأحزاب السياسية... إلخ. فالبيانات المتعلقة 
بمهامها الأساسية تشكل أحد الجوانب الأساسية لكيفية فهم هذه المنظمات لنفسها ودوائرها 
الانتخابية» وكيفية اتخاذ القرارات بشأن عملءاتها الحالية والمستقبلية. كما أن البيانات 
تقذم الإثبات والدليل للإنتاج المعرفي الذي يستخدم لإدارة ا منظمة بشكل أكثر laS‏ 
وفعالية» وتنافسية» وإنتاجية» وتحديد المنتجات والأسواق الجديدة (انظر القسم التالي). 


وهكذاء أصبحت نظم ال معلومات على مدى السنوات الستين الماضية من البنى التحتية 
الأساسية لجميع المنظمات على اختلاف أحجامهاء مما يمكنها من تتبّع وإدارة المجاميع البشرية 
المعقدة كام موظفينء الداعمينء المانحين» والعملاء» «css ls‏ والسلع الأساسية» والبنى التحية 
عبر الزمان واممكان» وتمكينها من توسيع نطاق عملياتها من ال مستوى المحلى إلى المستوى العالمي 
(Castells 1996; Dicken 2003)‏ فنظم المعلومات تتيح تشغيل المنظمات بشكل اكثر ذكاء. 
وإنتاج وفورات كبيرة من تكاليف قاعدتها التشغيلية. وهناك ثلاثة من هذه النظم المعلوماتية 
ا مبنية على البيانات والتي تمّ اعتمادها على نطاق واسع: نظم تخطيط موارد المنظمات (ERP)‏ 
ونظم إدارة سلسلة التوريد (SCM)‏ ونظم إدارة علاقات العملاء (CRM)‏ وتسهل هذه 
الأنظمة قدرًا أكبر من التنسيق والضبط داخل المؤسسة: ومع ا منظمات الأخرىء والعملاء. على 
سبيل «JUL‏ ينظم ويجمع نظام تخطيط موارد المنظمات العديد من قواعد البيانات والأنظمة 
امتعلقة بالشراء التخزينء الجرد» «JI‏ التسويقء ال محاسبة. إدارة شؤون الموظفين وإعداد 
قوائم المرشحين:ء إدارة المشاريعء والعلاقات مع العملاء في نظام واحد شامل يضمن بصورة 
سهلة وتلقائية توافر السانات والعمليات من جزء واحد من الأعمال لجزء آخر Dery et al.)‏ 
Grant et al. 6‏ :2006). كما تستخدم نظم إدارة سلسلة التوريد (SCM)‏ بأكبر قدر 
من الكفاءة لتنظيم اطمشتريات» والحركة: وإدارة وتخزين المواد من الموردين من الشركة وحتى 
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الزبائن )2012 (Chopra and Meindl‏ في حين تسعى نظم إدارة علاقات العملاء (CRM)‏ 
إلى بناء علاقات شخصية مع العملاء من خلال جمعها أنماط الحجوزات والمشتريات السابقة 
لهم» وعرض التفضيلات والخدمات ال ممكن الاستفادة منها خلال زياراتهم: والاستفادة منها في 
تقديم مكافآت الولاءء والعروض الخاصة:؛ والترقياتء وتقديم التوجيهات للموظفين والأنظمة 
ليظهروا مظهر العارف بالعميل )2005 .(Sigala‏ وقد Brynjolfsson et al. (2011) asi‏ من 
خلال دراسة شملت 179 شركة من شركات التداول العام الكبيرة على اعتماد هذه الشركات ف 
اتخاذ القرارات .42 على البيانات Ca» (Data Driven Decision- DDD)‏ يكون الناتج 
والإنتاجية أعلى ما يراوح بين 1-0 X‏ عما هو متوقع عند الاعتماد على استثماراتهم الأخرى 
وطرق استخدام تقنية المعلومات. 

las‏ إلى البيانات الكبيرة من قبل العديد على أنها المرحلة التالية في العملية الجارية 
التي تسعى إلى الكفاءة التنظيمية والبنى التي تعزز الميزة التنافسية» مع الحد من «ell‏ 
والتكاليف. والخسائر التشغيليةء وتحسين تجربة العملاء. فالذي توفره البيانات الكبيرة هو 
الإمكانية الشاملة وال مفصلة لغاية إدراك جميع جوانب عمل المؤسسة بشكل lI‏ ولحظي. 
وكما افترضت جماعة الضغطء. مؤسسة تك أمريكا ):2012 TechAmerica Foundation‏ 
12(« فإن البيانات الكبيرة ستضع الأساس: لاستبدال أو دعم عمليات اتخاذ القرار البشرية 
بخوارزميات آلية» مما يعمل على الحد من أوجه القصور داخل المنظمات؛ ويوجد الشفافية؛ 
ويحسن الأداء من خلال تمكن التجريب لاكتشاف الحاجات وإظهار التباينات؛ وتحسين العائد 
عن الاستثمار (ROT)‏ لاستثمارات تقنية المعلومات» وتحسين idas‏ اتخاذ القرار والتشغيل 
الذى؛ وتوفير قدرات تنبؤية لتحسين مخرجات المهام؛ والحد من التهديدات الأمنية والجريمة؛ 
والقضاء على الهدرء والاحتيالء وإساءة الاستخدام والمعاملة؛ وابتكار نماذج أعمال وخدمات 
مستفيدين جديدة. 

وبعبارة أخرى» ستوفر البيانات الكبيرة معرفة لحظية غاية في الدقة المفصّلة لكبار 
امديرين في جميع مناحي منظماتهم والتي يمكنهم من خلالها صباغة دورات عمل محكمة. 
وستمكن التنانات ]$5457 اللتظمات من أن تكون 351 :فظنة وملانة: 13529« تة 
4,555 في كيفيه تنظيمها وتشغيلها )2011 (Manyika et al.‏ 
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ومثال على كيفية التوظيف الناجح للبيانات الكبيرة من قبل منظمة غير تجارية 
لإعادة هيكلة وإدارة عملياتها الحملة الانتخابية لباراك أوباما عن الحزب الديمقراطي. 
فكما أشرنا في الفصل الرابع» فقد تبنت الحملة الانتخابية لأوباما البيانات الكبيرة» من 
خلال جمع مجموعة هائلة من البيانات من مصادر متعددة وإنتاج بيانات اقتراع معتبرة 
لحظيا في الوقت المناسبء من أجل إدارة 3 الفعل: وتشكيل الإستراتيجية: والإجراءات: 
ومهام العاملين والمتطوعين. واستنادًا إلى تحليل الأداء عام ۲٠٠۸‏ فقد نمت مجموعة 
تحليلات البيانات للحملة الانتخابية لأوباما للعام ۲١٠۲‏ في الحجم خمسة أضعاف عنها في 
حملة ۲٠١۸‏ متضمنة روادا تقنيين جرى التعاقد معهم من سوق الصناعة )2012 (Scherer‏ 
وقد حسّنت هذه المجموعة العلائقية بين البيانات التي تمّ جمعها من مصادر مختلفة 
بحيث أمكن ربطها معا بشكل أكثر فعالية. كما طوروا تطبيقات للحملة الانتخابية. وجرى 
استخدام شبكات التواصل الاجتماعي مثل فيسبوك للدفع باتجاه التسجيل للانتخاب 
والحصول على التضويت لصالحهاء وتشيت ملفات تعريف الارتىاط (Cookies)‏ الخاصة 
بهم els‏ المتعلقة بأطراف تم التعاقد معها على أجهزة الزائرين موقعهم الإلكتروني 
لجمع البيانات عنهم وتتبع عاداتهم على الشبكة )2012 (Crovitz 2012; Kaye‏ 
كما قاموا بتحسين تصنيفاتهم التعريفية وتوقعات النماذج التنبئية وكيفية استخداه 
المعلومات الناتجة عن تحليلاتهم لتوجيه الحملة» بالإضافة إلى اختبار وصقل طرق زيادة 
التمويل لدعم الحملة مالا )2012 .(Scherer‏ كما أضافوا وعالجوا السانات الجديدة 
بشكل مستمر مع تشغيل لأنظمة ال محاكاة للتنبؤ بالنتائج وأفضل الردود. وكما صرح 
أحد 195.5( الحملة: "لقد شغلنا نموذج المحاكاة 77,0٠٠‏ آلف مرة في كل ليلة" لتحديد 
احتمالات الفوز في كل ولاية متأرجحة". وفي كل صباح يصل إلينا الناتج» هذه هي فرص 
نجاحكم في الفوز في هذه الولايات» وبهذه الطريقة تم تخصيص اموارد (مقتبس عن 
da> sä .(Scherer 2012‏ فريق Gb sl‏ على مزايا مهمة عن منافسيهم من خلال 
التشغيل ال مستمر مجموعات قواعد CUI‏ المتغرة من خلال خوارزميات متطورةء 
adeg‏ أشار )246 :2012( Issenberg‏ إلى أن حملات آوباما الانتخاسة كانت "ال لمجموعة 
FATT di ares ESE‏ حتداء القافة E E Le‏ اوا اة áo exl‏ 
الصارمة ". وهذا هو وعد ölel‏ للبيانات الكبيرة بأن الفوائد العائدة عنها كالتي اكتسبها 
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الحزب الدمموقراطي من البيانات الكبيرة» لها أن تتحقق لجميع المنظمات وغيرها من 
شركات قطاع الأعمال. 
تحصيل القيمة وإنتاج رأس (Leveraging Value and Producing Capital) JUI‏ 
فضلا عن جعل الشركات أكثر كفاءة وفعالية ف إدارتهاء يتم الترويج بكثافة للبيانات 
الكبيرة لتكون وسيلة لرفع مستوى القيمة الناتجة من أنشطة الشركة وعلاقاتها مع الموردين 
والمستهلكين. وف الواقع: وكما أشار )2011( «Gantz and Reinsel‏ فإن ال محرك الرئيسى 
للبيانات الكبيرة ليس Gi‏ ولكنه مالي مع الوعد بالمزيد من الكفاءة والأرباح. ومن ثم 
فإن اعتماد حلول البيانات الكبيرة هو إستراتيجية لإدراك تراكم رأس JUI‏ غير المستغل 
بطريقة تقدم عائدا کا من الاستثمار وتوفير ميزة تنافسية );2011 Manyika et al.‏ 
.(Zikopoulos et al. 2‏ وهناك العديد من الطرق التي يمكن من خلالها لحلول 
البيانات الكبيرة أن تضفى الذكاء للشركات وبطريقة هكن معها أن تنمو مبيعاتها وأرباحها. 
فمع الأخذ لقطاع البيع بالتجزئة «JUS‏ حدّد )2011( Manyika et al.‏ ستة عشر حلا 
مقسّمة إلى خمسة أنواع - التسؤيقء ugly‏ والعمليات. وسلسة التوريدء ونماذج الأعمال 
الجديدة - مكن لكل منها تحصيل مكاسب محتملة 3 JL as‏ المسيعات والكفاءة (انظر 
الحدول .)۷-١‏ وهي تمل إنتاج بيانات عير الشركة وتطبيق البات التحليل من أجل 
تقسيم السوقء والتصدى لعزوف العملاء والموظفين» وتحسين المد خلات ال مختلفة de)‏ 
سبيل اطثالء «63S I‏ والعمالة» وال مرافق) وتؤدي من ثم إلى بناء مختلف التشكيلات 
والنماذج التنبئية للإجابة عن مجموعة متنوعة من الأسئلة من قبيل: 
e‏ هل يتم الاتصال بالعميل el‏ لا (التسويق ا مستهدف)؟ 
o‏ هل يتم تقديم عروض للاحتفاظ بالعميل el‏ لا (المحافظة على العملاء)؟ 
٠‏ أي نوع من الإعلان أو اختيار الكلمات / الصور أو exl!‏ تقدم للعميل (انتقاء ال محتوى)؟ 
o‏ أي قناة ينبغي الاتصال من خلالها بالعميل (اختيار القناة)؟ 
ه هل يتم تقديم عرض del‏ أو أقل JC‏ للعميل (التسعير /الخصم امتغير)” 
٠‏ هل ex‏ شطب جزء Sl‏ من الدين عن ال مقترض (التحصيل)؟ 
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۰هل يتم تقديم حد ائتماني del‏ أو أدنى أو معدل فائدة للعميل (مخاطر الائتمان)؟ 
(Siegel 2013)‏ 

وللتركيز على نوع واحد من أنواع الحلول الخمسة التي قدمها )2011( .Manyika et al.‏ 
وهو التسويقء مكن استخدام عدد من آليات التحليل وأدوات إدارة البيانات الكبيرة 
ا موزعة في أربعة محاور هي: التوحيد والاختزال» التقسيم والتجزئة: المطابقة. والتحسينء 
وذلك لإدارة ومعالجة وتحليل وتفسير البيانات من أجل تلبية الأهداف (انظر شكل (V - ١‏ 
إن هدف التسويق السلوك هو بيع البضائع والخدمات بصورة أكثر فعالية للأفراد والعملاء 
وبناء علاقة طويلة المدى معهم من أجل الحفاظ على عاداتهم وذلك من خلال الانسجام مع 
خصائصهم» وسلوکهم» 375-55( ورغباتهم )2011 501076 .(Schwartz and‏ فمن خلال 
بناء الملفات التعريفية الفردية للأشخاص ودمجها ga‏ التحليلات التنبئية» تسعى الشركات 
إلى تقديم تجربه شخصية من خلال التسويق الجزني للمنتجات والعروض الخاصة. وق 
سبيل ذلك» تسعى الشركات إلى توقع نية العميل في الشراء وتسهيل تحقيقهم لهذه النية 
بلطف» مع السعي لبناء ولاء العملاء قي الوقت نفسه )2013 (Minelli et al.‏ وق ذات 
Lx‏ « زعم Bill Stensrud‏ أن "اموزعين يستخدمون البيانات الكبيرة في محاولة للحصول 
على المستهلكين" ) مقتبس $ 24 :2010 (Bollier‏ 

وقد تم بالفعل تنفيذ مثل هذا النهج للبيانات الكبيرة من قبل عدد من تجار التجزئة 
مثل وول مارت وتيسكو. حيث تنتج مثل هذه السلاسل من ال متاجر كميات هائلة من 
البيانات يوميًا من خلال نظم تخطيط موارد المنظمات (ERP)‏ وإدارة سلسلة التوريد 
(SCM)‏ وإدارة علاقات العملاء (CRM)‏ الخاصة Le dy‏ في ذلك ربط منافذ المبيعات 
بالزبائن من خلال بطاقات الولاء والاتتمان ) في حالة وول مارت هناك ما يقارب FIV‏ 
مليون معاملة (Lass‏ واستخدامها لوضع إستراتيجيات أفضل للأسعار. ومخططات التخزينء 
وإعداد قوائم اللموظفينء ومراقبة المخزون: والحملات الإعلانية» وتكاليف ال موردء وتحديد 
مواقع جديدة للتخزين وامنتجات....إلخ: واقتطاع حصة من سوق منافسيها عند القيام 
بذلك )2010 (Bollier‏ وعوضا عن إجراء مسوح عينية ضيقة ودراسات استقصائية باهظة 
«dal‏ لاستطلاع آراء ا مشاركين عن ماذا سيفعلون» وما هي القيمة المعتبرة بنظرهم» تقوم 
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البيانات الناتجة عن العمليات والتصفح على الشبكة بالكشف عن هذه ال معلومات عبر 
جميع الملستهلكين. فالفوائد المتوقعة مرتفعة. حيث يشير )2011( Manyika et al.‏ إلى 
أن البيانات الكبيرة يمكن أن تزيد هوامش التشغيل لتجار التجزئة بنسبة ١0‏ ف 3s «UI‏ 
حين أن هذه الحلول المتعلقة مبيعات التجزئة والتسويق من ال ممكن أن تتوفر في مختلف 
القطاعات» ol‏ درجة بروزها يختلف من قطاع لآخر بين مختلف القطاعات الأكثر استفادة 
من حلول معينة (انظر الجدول (V-Y‏ 

(V - ١( الجدول رقم‎ 


البيع العابر للحدود (باستخدام ال مواقع الجغرافية للزبائن» وتاريخ الشراء 

(Marketing)‏ والتفضلات» وا ملعطيات TES‏ لزيادة متوسط حجم الشراء) 
التسويق القائم على الموقع (باستخدام الموقع الحالي بشكل آني أو «uod‏ 

على سبيل JULI‏ نظام تحديد المواقع الجغرافية في الهواتف ASI‏ 
واستهداف الزبائن الموجودين في المتاجر أو بالقرب منها) 
تحليل السلوك داخل المتاجر (تتبع الهواتف ASII‏ وسلال التسوقء واطراقية 
امرئية للمساعدة في تحسين مخطط توزيع امتجرء وتنوع «ola‏ ومواضع 
الأرفف لزيادة (Cols‏ 
التقسيم الجزني للعملاء (استخدام تاريخ الشراء والتصفح لاستهداف العملاء 
بشكل فردي بالإعلانات والعروض الخاصة) 

التحليل العاطفي (تتبع 9 cll Ja2‏ العملاء على مواقع التواصل الاجتماعي 
لتحديد ميلهم تجاه منتج ما وتعديل الحملات التسويقية بشكل مناسب) 
تعزيز تجربة العملاء مع تعدد القنوات (إنشاء تجارب وفهارس على شبكة 
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e ف‎ 
5 : | 
* 


(Merchandising) 


تحسين التشكيلة (تخصيص البضائع لحفظها في sl‏ من المتاجر استنادًا إلى المواقع 
الجغرافية ال محلية» وانطباع ا مشترين وسلوكهم» والحقائق المحلية الأخرى) 


تحسين التسعير (باستخدام السلوكيات الشرائية والجغرافية لاتخاذ قرارات 


التسعير في مختلف اللمواقع لزيادة المبيعات / الأرباح) 
تحسين التموضع والتصميم (باستخدام السلوك داخل المتجر والتفاعلات على 
الموقع الإلكتروني لتوجيه عملية تصميم الموقع / المتجر وأماكن وضع البضائع 
لزيادة المبيعات) 





العمليات 
(Operations)‏ 


شفافية الأداء (التحليل المفصّلء بشكل GT‏ أو لحظي على نحو متزايدء لتحديد 
تحسين مدخلات الموظفين (احتساب المستويات المثلى للتوظيف وجدولة 
المناوبات لتفادي فرط التوظيف أوشح القوى العاملة) 







سلسلة التوريد إدارة المخزون (تحسين توقع المخزون من خلال رصد تواريخ ال مبيعات. 
(Supply Chain)‏ ودورات ال مبيعات الفصليةء والأحداث والظروف ال محلية لضمان مستويات 
مناسبة من 55524 المطلوب) 
لحظي» واحتساب مسارات الطرق الأكثر ملاءمة وكفاءة من حيث الوقت 
والوقود. ومراقبة سلوك السائقينء وجدولة أعمال الصيانة) 
مفاوضات الموردين (باستخدام البيانات المتعلقة بتفضيلات ال مستهلكين 
ومشترياتهم لإبلاغ مزودي المنتجات) 





نماذج الأعمال خدمات مقارنة الأسعار (تقديم خدمات مقارنات شفافة من أطراف ثالثة 
الجديدة New)‏ للزبائن لأسعار المنتجات بشكل آني أو لحظي عبر مختلف تجار التجزئة) 


Business Models) 


الأسواق القانئمة على الويب (تجار التجزئة الذين يقدمون Obas‏ بقيمة 
مضافة مثل الوصول إلى الباعة الآخرينء: ومعلومات ال منتجات» واطراجعات 
الناتجة عن المستهلكينء ومقارنات الأسعار) 


.Manyika et al.2011:67-71 المصدر : جمعت من‎ 
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مقتبس من "البيانات الكبيرة: آفاق جديدة للابتكار والمنافسة والإنتاجية"» (معهد 
ماكىنز ي العامي (May 2011) Mckinsey Global Institute‏ 


.(www.mckinsey.com/mgi.Mckinsey&Company) 


وإضافة إلى الدفع بالفوائد المتوقعة, سعى دعاة البيانات الكبيرة أيضا إلى دعم اعتمادها 
من خلال تسلبط الضوء على عواقب فشل الاستثمار فيها. على سبيل JELI‏ أشار Manyika‏ 
et al. (2011: 6)‏ الى أنهم: "يتوقعون أن يرون» عبر القطاعات» تحقق القيمة التي تعود 
على المستخدمين الرئيسيين للبيانات الكبيرة على حساب المتقاعسين عنها". وبعبارة $55« 
سوف يتخلف أولئك الذين لا يستطيعون التأقلم واعتماد حلول البيانات الكبيرة عن الركب 
ويتعرضون للتعثر والأفول؛ لأنهم سيفقدون حصتهم في السوق. وبغض النظر عما إذا كان 
استخدام الخطابات للدفع أو الجذبء. فقد أضحت البيانات الكبيرة للأعمال منتشرة داخل 
التيار الرئيسي ووسائل الإعلام التجارية منذ العام 2012م: وبالنظر لفوائدها الموصوفة؛ يبدو 
أن البدء في تطبيقها على نطاق واسع سيمثل المرحلة التالية للابتكار التقني وذلك بصورة 
ا 
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(V - Y) الشكل رقم‎ 


التسويق والسانات الكبيرة 


أهداف المسوقين قدرة المنصة 


مسارات النقر 
Ollas)!‏ 
الأحداث 
إدارة علاقات العملاء 
مكاطمات الدعم 


55( نظرة أحادية للعميل 


التوحيد والاختزال 


التكتل/التجميع 
حيازة البيافاكٌ 


اختبازا الخصائّض 
الربط 


2 





الرسائل الشخصة 


id meee (9‏ عبت ستيه 
3 تجزئة القيمة الأحادية 





التنبؤ 
خوارزميات التنبؤ 


الربحية العالية للحملة p‏ شجرة القرارات 
زمه الانحدار الخطي 


امصدر: مقتىس من 2012 .Claverie-Berge‏ 


تم إعادة الطباعة بإذن من المؤسسة الدولية لآلات الأعمال» © اللمؤسسة الدولية لآلات الأعمال 
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الحدول رقم (V - Y)‏ 
فوائد البيانات الكييرة لعشر صناعات مختارة 


المراقبة المتقدمة للحالة تحديد التصرف القادم الأمثل 


مطالبات الضمان الغش في المطالبات 










تحديد التصرف القادم الأمثل المراقبة المتقدمة للحالة 
تحليل سجل النظام 






مراقية وتحسين الإنتاج 


تحليلات العداد الذي التحسين الآلي للأسعار 
التنبؤ بتوزيع الأحمال وجدولتها التشكيل اممحاي 
الصيانة بحسنا الحالة لحسان التسويق 


منع الجرائم والتهديدات والتنبؤ بها ضمان الخدمة الأفضل 
تحليلات الاحتيال والنفايات وإساءة ال معاملة ذكاء الشركة 


استحداث منتجات وخدمات جدددة 


التدبير والتصرف بناء على الصحة العامة تحليلات العملاء وولائهم 


إشراك المستهلكين في رعايتهم الصحية الصبانة التنبئة 





( CIBM (n.d) e! g المصدر: أي‎ 


http://www-01.ibm.com/software/data/bigdata/industry.html 
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إيجاد أماكن أفضل: 

اخترع الناس واعتمدوا على مر التاريخ على تقنيات جديدة صممت لإنشاء الثروة 
وتحسين الحياة اليومية وتعزيزها. وقد أثرت العديد من هذه التقنيات بشكل كبير 
على طبيعة وهيكل وتنظيم Suus‏ الحياة المدنية والريفيةء في الخدمات الخاصة المقدمة, 
والنقلء والاتصالات» وبناء البنية التحتية. فهذه التقنيات تحمل ف كثير من الأحيان 
تأثرات متناقضة وسلبية على سبيل JEL‏ المصانع التي صنعت الثروات» وفي الوقت 
نفسه التلوث البيئي TR)‏ أو أن تكون الغا فيها (uoo‏ تتجاوز الطاقة الاستبيعابية 
على سبيل JELI‏ الاكتظاظ أو الازدحام المروريء أو تنتج التبعيات التي لا يمكن أن 
تطاق على سبيل JELI‏ المسافات الطويلة بين مواقع السكن ومواقع العمل. إن تقنيات 
المعلومات والاتصالات (تكنولوجيا المعلومات والاتصالات) هي أحدث موجة من الأجهزة 
والبنى التحتية الجديدة التي أضحت جزءًا Y‏ يتجزأ في نسيج البيئة التي نعيش بهاء 
ومعها OSS‏ مهم من مكونات منطقها الاستطرادي وهو أنها تعمل على توفير الحلول 
للمشاكل الناجمة عن الدورات السابقة من التنمية التي قادتها التقنية - بحيث تجعل 
منها أكثر كفاءة واستدامةء ونظافة. وأمناء وإنتاجية... إلخ - وكذلك إنشاء طرق جديدة 
ماما للعمل ف العام المحيط. رونتيجة لذلك» تبنت المدن تقنية المعلومات والإتصالات. 
على مدى العقوذ القليلة الماضية» باعتبارها عنصرا أساسيًا في إستراتيجياتها الإنمائية 
(Castells 1996; Graham and Marvin 1996; Kitchin 1998)‏ 

إن مفهوم Sall‏ الذكيه هو تجسيد لهذه JI‏ 453 التي lassi‏ تقنيات المعلومات 
والاتصالات للتنمية اممدنية والذي يصف الأماكن التي تتكون بشكل متزايد وتراقب بواسطة 
الحوسبة المنتشرة والحوسبة في كل مكان. ويقود ضبط اقتصادها وإدارتها الإبداع: والابتكارء 
وريادة الأعمال. من قبل أناس أذكباء. وهذه المدن SII‏ مجهزة بشكل مكثف ومكن 
فهمها وضبطها بشكل آني أو لحظي؛ فهي تنتج وتتبادل» 39 io on qua‏ وتعمل على 
البيانات الكبيرة )2014 (Kitchin‏ إن مثل هذه البيانات الكبيرة Nt RA‏ شاملا ومتغيرا 
ومفضّلا بدقة لهذه المدن والمدخلات للأنظمة التي من شأنها بناء أماكن أكثر ملاءمة للعيشء 
وامنة.» ووظيفية: وتنافسبة. ومستدامة )2013 .(Hancke et al. 2013; Townsend‏ فمثل 
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هذه الرؤية للمدن الذكية يجري الترويج لها بشكل كبير من قبل عدد من أكبر مزودي 
خدمات البرمجيات في العام وشركات الأجهزة الرقمية (على سبيل «JUL‏ سيسكوء وآي بي 
«el‏ ومايكروسوفت» وإنتل» وسيمنزء وآوراكل» وساب) والتي اعتمدت بحماس من قبل 
المؤسسات البلدية والوطنية والعابرة للحدود التي تتوقع لتقنيات اللمدن الذكية ان تنتج 
تقدم اجتماعي-اقتصادي وتجدد امراكز المدنية لتصبح مراكز للابتكار والعمل Kourtit et)‏ 
(al. 2012‏ وف حين تم slo‏ بعض مشاريع المدن الذكية من الألف إلى الياء (على سبيل 
اطمثال. سونغدو (Songdo)‏ أو مدينة مصدر «((Masdar City)‏ فان معظم هذه امشاريع 
تدريجية» وتتألف من إعادة تجهيز للبنية التحتية القانئمة مع تقنيات رقمية وحلول للبيانات؛ 
لأن الوظيفة الرئيسية للبيانات الكبيرة في كلتا الحالتين هي توفير تحليلات بشكل آني أو 
لحظي لإدارة كيفية جوانب وظيفة المدينة وتنظيمها. 

لقد استخدمت هذه امراقبة وآليات تحليل البيانات الآنية واللحظية لعدد من السنوات 
في بعض القطاعات. على سبيل JELI‏ قيام العديد من ا مدن ببناء أنظمة النقل ASII‏ 
ilg‏ تستخدم البيانات الناتجة عن شبكة من الكاميرات والنواقل والمتعلقة بحركة ا مرور 
حول نظام ما لتقديم تغذية راجعة مركز تحكم مركزي» وتستخدم مراقبة وتنظيم التدفق» 
وتعديل تسلسل حركة المرورء وحدود السرعة الملسموح بهاء وإدارة العقوبات المتعلقة 
بامخالفات المرورية بشكل تلقان .(Dodge and Kitchin 2007a)‏ وبامثلء. فقد ترصد 
وتراقب الشرطة مجموعة من الكاميرات وسجلات الحوادث الحية من أجل توجيه الموارد 
ا مناسبة لمواقع معينة للاستجابة السريعة وبكفاءة. كما هكن جمع البيانات المتعلقة 
بالظروف البيئية من خلال شبكة استشعار موزعة في جميع أنحاء المدينة» على سبيل 
«JULI‏ قياس وتتبع تلوث الهواءء ومستويات المياهء أو النشاط الزلزالي. وتستخدم العديد 
من الحكومات المحلية نظم إدارية لتسجيل مشاركات الجمهور وتفاعله مع خدماتها. وف 
جميع الحالات تقريباء كانت هذه الأنظمة معزولة عن بعضها البعض وتتعامل مع قضية 
واحدة ويتم التحكم بها من قبل وكالة واحدة. 

وفي الآونة الأخيرة. كانت هناك محاولة لجمع كل هذه الأنواع من المراقبة والتحليل في 
مركز واحد» وأن تستكمل بآليات تحليل عامة ومفتوحة على نطاق أوسع. على سبيل «JUN‏ 
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قام مركز العمليات في ريودي جانيروء البرازيل» والذي تم إنشاءه بالشراكة بين حكومة 
المدينة وشركة آي بي cel‏ بتجهيز نظام على مستوى كافة أنحاء المدينة حيث يجمع البيانات 
من ثلاثين وكالة معا في مركز موحد لتحليلات البيانات» Le‏ في ذلك حركة المرور والنقل العام 
والبلدية وخدمات المرافق» وخدمات الطوارئ» ونقاط جمع بيانات الطقس» وا معلومات 
المرسلة من قبل الموظفين والجمهور عر الهاتف» والإنترنت» والراديو (انظر الشكل 7.2 
.(Singer 6‏ هناء تعمل الخوارزميات وفريق من المحللن على معالجة. 94239)« 
وتحليل» ورصد كميه dila‏ من بيانات الخدمه dadl‏ جنبا إلى جنب مع البيانات المجمعة 
مع مرور الزمن وكميات ضخمة من البيانات الإدارية التي تم إصدارها على أسس دورية 
بصورة أكبرء وغالبا ما يتم المزج بين مجموعات البيانات معا للتحقيق في جوانب معينة من 
حياة المدينة والتغييرات الحاصلة فيها مع مرور الوقتء وبناء النماذج التنبئية فيما يتعلق 
بالتنميسة' والإدارة.اليومية للمدينة وإدارة حالات الكوارث كالفيضانات:  daSos‏ هذا عن 
طريق منصة العمليات الافتراضية التي تمكن المسؤولين في المدينة من تسجيل الدخول من 
ا ميدان والوصول إلى المعلومات بشكل آني أو لحظي. فعلى سبيل «JULI‏ يمكن للشرطة 
في مشهد الحادث ال مروري استخدام المنصة لمعرفة عدد سيارات الإسعاف المرسلة للموقع 
وموعد وصولهاء وتحميل معلومات إضافية على الموقع .(Singer 2012c)‏ وكان الهدف 
امعلن من عمدة امدينةء إدوارد (Eduardo Paes) yob‏ هو إسقاط الحواجز بين الإدارات 
وضم سانات كل منها إلى الآخر Bae Lu‏ ال منظومة بأكملها .(Singer 2012c)‏ كما $529 
تطوير مراكز مماثلة في أماكن 5,21« يصاحبها مجموعة من التطبيقات للمواطنين للوصول 
والاستفادة من بعض مناحي البيانات. 

Ul‏ بالنسبة لأولئك العاملين على تطوير واستخدام آليات تحليل متكاملة وآنية 
لبيانات المدينة» فإن مثل هذه المراكز والتطبيقات توفر وسائل فعالة لاستشعار وفهم 
العيش ف المدينة وإدارتها في الوقت الراهن» وتصوّر وتوقع السيناريوهات ال مستقبلية: 
وإجراء توزيع ال موارد بالاعتماد على الدليل وتسهيل التفكير la sd RAE‏ عبر الحكومة 
Yag (Flowers 2013; Kitchin 2014)‏ من اتخاذ القرارات استنادًا إلى الكلام 
المتداول: أو الحدس والظنء أو المحسوبية: أو Wol‏ دورية / جزئية» فمن الممكن تقييم 
ما يحدث في آي وقت» والرد والتخطيط المناسب له. 
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الشكل رقم (V - Y)‏ 
مركز العمليات لوسط مدينة ريودي جانيرو 
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وعلاوة على ذلك» يوفر استخدام عينات كبيرة وربط أشكال متنوعة من البيانات 
تحليلا أكثر عمقاء وشموليةء وقوة. وقد أصبح من الممكن للدعاة لمثل هذه الأنظمة 
تطويرء وتشغيلء وتنظيم» وخوض غمار الحياة في المدينة على أساس قويء ودليل 
pihi‏ غير ضعيفء. لا دليل QU!‏ مبنى على اسس إيديولوجية سياسية Flowers)‏ 
73. وهكذاء فثمة من «Jas‏ إن استخدام هذه البيانات الكبيرة سيوفر الأساس 
طدينة أكثر فعاليةء واستدامة» وتنافسية: وإنتاجيةء وانفتاحاء وشفافية. إلا أن آخرين 
يحذرون من أن البيانات الكبيرة تشر إلى احتمالات الوصاية Big Brother"‏ "< وأشكال 
الحكم القائم على التقنية «(Technocratic)‏ وخصخصه (Corporatisation)‏ إدارة 
امدينة (انظر الفصل العاشر). 


الخلاصة: 

رسم هذا الفصل الدوافع الدعائية للبيانات الكبيرة فيما يتعلق بأربع مهام رئيسية 
هي: حكم الشعبه وإدارة ا منظمات؛ وتعزيز القيمة وإنتاج رأس JUI‏ وإيجاد أماكن 
أفضل للحياة (حيث سيجري مناقشة إمكاناتها بالنسبة للعلوم في الفصل التالي). وقد 
Cus‏ المناقشة الكيفية التي يتم بها تأطير البيانات الكبيرة سياسيًا واقتصاديا (انظر الفصل 
الأول) وكيف يتم وضع مجموعة قوية من البيّنات والحجج العقلانية لدعم البدء في 
تنفيذ واعتماد تقنيات البيانات الكبيرة وحلولها. وتتضح قوة الأنظمة الخطابية التي 
يجري بناؤها من خلال النظر في الحجج المضادة - حيث من الصعب أن نقول إننا نريد 
أن نبقى ف حالة أقل pas‏ وحكمة» وإنتاجيةء وتنافسية: وكفاءةء وفعاليةء واستدامة 
وأمنا... إلخ. فإذا كانت البيانات الكبيرة تقدم كل هذه الفوائد. فإن دعاة البيانات 
الكبيرة يجدون من غير المنطقي عدم sabl‏ قدما في تطوير نظم البيانات الكبيرة ودعمها. 
وبطبيعة الحال فإن الحجج التي قدّمت هي ضيقة وانتقائية وتبتعد عمدا عن تسليط 
الضوء على الآثار السلبية المحتملة فيما يتعلق بالحريات المدنية» ومراقبة البيانات» والفرز 
الاجتماعيء als‏ البيانات» وانفلات زمام التحكم وفرض السيطرة: والحكم الاستباقي: 
والحكم التكنوقراطي (القائم على التقنية) والخضخص:: وغلق التقنيات وعدم إتاحتها 
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بصورة أكبر (انظر الفصل العاشر). فهذه هي وجهة نظر أصحاب المصالح الخاصةء ولا 
سيما أولئك الذين يسعون لبيع تقنيات البيانات الكبيرةء والحكومات التي تسعى نحو 
رؤية الليبرالية الجديدة للحكم والتنظيم (الليبرالية الجديدة: هي فكر أيديولوجي s‏ 
تأييد الرأسمالية ال مطلقة وعدم تدخل الدولة ف الاقتصاد.). وليست وجهة نظر ا مواطنين 
أو المجتمعات التي من ال ممكن أنها لا تزال من دعاة البيانات الكبيرة والحوسبة في كل 
مكان» ولكنهم يتصورون أن استخدامها سيكون بطرق تحررية» وتمكينيه» وتشاركية مع 
إخضاع التأثيرات الأكثر سلبية للرقابة والتنظيم. 

لقد تميز التحليل المعروض في هذا الفصل بالإيجازء مع توفير dab‏ شاملة لبعض الحجج 
التي تطرح. وما هو مطلوب في الوقت الحاضرء من خلال دراسات الحالة المحددة: هو 
تفصيل وتمحيص للأنظمة الخطابية التي تتكشف ويجري بناؤها. على سبيل المثال» فيما 
يتعلق بالترويج للبيانات الكبيرة في المدن الكبيرة» فهناك حاجة لرسم وتجزئة الكيفية 
التي تروّج بها مختلف الخطابات الداعمة فيما يتعلق بأماكن مخددة من خلال المجلات 
التجارية وامواقع الإلكترونية. والصحف اليومية» وامواد الترويجية للشركات» وسجلات 
الدولةء والبيانات السياسية... ed)‏ وتقاطعات الأجندات ال مختلفة ومصالح ال معنيّين. وهذا 
يحتاج إضافة إلى تحليل الكيفية التي يتم بها التصدي مثل هذه الخطابات برؤى Abo‏ 
وتحليل المعآرضات والتداغل با الحجج الخطابية وتتبعتسلسْل الكيفية التى تحولت 
بها مع مرور الوقتء والتحليل المقارن للمشهد الخطابي عبر مختلف البقاع: أن يصاحبه 
تحليلٌ لآثار الخطابات على تشكيل الكيفية التى يعمل بها المجال في الممارسة والنتائج 
المترتبه على تنفيذ حل البيانات الكبيرة. 

وبالنسبة فيما يتعلق بالنقطة الأخيرةء بين )2014( Salmon‏ بالتفصيل أنه بمجرد أن يتم 
تطبيق حل قائم على البيانات فإنه من النادر أن يحقق الفوائد التي توقعها ا لمتحمسون 
والداعمون لذلك الحلء وغالبًا ما ينتج عن الحل مجموعة من القضايا الجديدة. وقال 
al‏ توجه لقانون كامبل (Campbells Law)‏ الذي صاغه عام الاجتماع دونالد Lals‏ 
(Donald T. Campbell (1976‏ ليشرح هذه الظاهرة. فقانون کامبل ينص qÀe‏ إنه 
كلما ü el Ao E‏ مؤشر اجتماعي كمي لصنع القرار الاجتماعى» كلما كان ا موضوع 
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تحت ضغوط الفساد وأكثر عرضة للتشويه وإفساد العمليات الاجتماعية التي يهدف 
luo) di‏ أو يحب dil‏ لفون sud‏ "كلها جرف oic‏ ضفل allis‏ اكل 
أكبر. أوجد هذا النظام المزيد من الدوافع للجميع (الموظفينء والعملاء والمنافسين) لتغيير 
سلوكهم بطرق منحرفة ضارة - مما يوفر أكثر من الشيء الذي تم تصميم النظام لقياسه 
وإنتاجه. سواء كان لذلك أي قيمة في الواقع "Y el‏ 

وبعبارة أخرىء يبدأ الناس في اللعب على النظام بعقلانية واعتبار المصلحة الذاتية 
ولكن في كثير من الأحيان بطرق غير متوقعة لإفساد المقاييسء والخوارزميات» وعمليات 
صنع القرار JYI‏ على سبيل JLL‏ أشار )44 :1995( Porter‏ إلى أنه "عندما يتم 
الحكم على مديري الأعمال من خلال حساباتهم» فإنهم يبدؤون التعلم على كيفية 
تحسين حساباتهم» Le‏ من خلال بعض الحيل من قبيل تأجيل الصيانة اللازمة وغيرها 
من التكاليف ذات المدى الطويل". ونتيجة لذلكء فإنه في حين OLE‏ أن تتحول LAS‏ 
إدارة وتشغيل ال منظمات والحكومة:؛ لتصبح قانمة على البيانات ومقاييس الأداء. فإنه من 
لمحتل أن دحا ت لذارا کی عة i9‏ وك وتفغل ادال dia‏ من iS lod]‏ 
ليس بالضرورة أن تكون إيجابية في مجملها. 

ولذاء تحتاج دراسات البيانات الكبيرة وآثارها إلى الانفتاح لعرض السياسات والأجندات 
الكامنة للبيانات الكبيرة في مختلف السياقات وتوفير أساس لمزيد من المحادثات ال معيارية 
حول هذا النوع من عوام البيانات الكبيرة التي قد نرغب ف العيش بها. فهذه الأنواع 
من امحادثات هى قيد التطوير في الوقت الحاضرء ويرجع ذلك بشكل جزن إلى حداثة 
التطورات وسرعة وقوعهاء وأيضا بسبب هيمنة الأطروحات BILLI‏ بها عن البيانات الكبيرة 
ومكائد أصحاب ال مصلحة ال معنيين بها. ومع ذلك. تضل الحاجة قائمة لمثل هذه الأحاديث 
بالنظر إلى أن البيانات الكبيرة تعيد تشكيل الطريقة التي يجري بها حكم المواطنين: 
وتنظيم الممواقع» وإدارة المنظمات» وعمل الاقتصاديات» وممارسة العلوم. 
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The Reframing of Science, Social Science and) 


(Humanities Research 


في حديث مجلة الإيكونيميست ف العام 2010 م» SS‏ سنان ارال (Sinan Aral)‏ 
أستاذ إدارة الأعمال في جامعة 5555« أن "الثورات ف العلوم غالبًا ما يسبقها ثورات في 
القياس" aiia)‏ عن 2010 .(Cukier‏ إن هذا الفصل يستكشف مدى انطباق ملاحظة 
آرال فيما يتعلق بالبيانات الكبيرة: والبنية التحتية للبيانات» والبيانات المفتوحة: وتأثراتها 
فيما يتعلق بكيفية مقاربة البحوث والاكتشافات الأكاديمية من منظور فلسفي ومنهجي. 
deg‏ وجه الخصوصء agi‏ هذا الفصل بدراسة كيفية تحدى توافر البيانات الكبيرة والبنى 
التحتية للبيانات إلى جانب الأدوات التحليلية الجديدة للنظريات والعلوم المعرفية القانئمة 
في مختلف التخصصات- الكيفية التي يتم بها طرح الأسئلة وكيفية الإجابة عنها- ويؤدي إلى 
نشوء مخالات وتخضصات جديدة. diag‏ يستكشف هذا الفصل ما إذا كانت التغيرات 
التي تطرأ على الطريقة التي يتم بها إنتاج وإدارة وتحليل المادة الخام للمعلومات وا معرفة 
ستؤدي إلى تغيير جذري في فهم وممارسة المبادئ الأساسية التي تقوم عليها العلوم» والعلوم 
الاجتماعية والإنسانية. وبعبارة 5,51« هل تقود ثورة البيانات إلى نقلة نوعية في المجالات 
الرئيسية للعلوم والبحوث؟ 

Jie‏ النموذج (Paradigm)‏ كما حدده كوهن )1962( Kuhn‏ وسيلة مقبولة لاستجواب 
العام وجمع ال معرفة المشتركة بين نسبة كبيرة من الباحثين في اختصاص معين في لحظة زمنية 
معينة. ويتشارك الباحثون العاملون ضمن نطاق هذا النموذج في فلسفة واحدةء واستخدام 
مجموعة من الأساليب الشائعة» وطرح الأسئلة والإجابة عنها dal‏ على بناء المعرفة بصورة 
تدريجية. ومن ثمء فإنهم ميلون إلى تفضيل التصنيفات» وال معارفء والنظريات» والأساليب. 
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والأطر الأخلاقية والعقائدية نفسها أو القريبة من بعضها البعض. ومع ذلك فقد أشار 
كوهنء وبصورة متكررةء إلى بروز طرق جديدة للتفكير تتحدى النظريات واممناهج المقبولة 
والمعمول بها. على سبيل مثال» فإن النظرية النسبية لآينشتاين جابهت» وإلى حد كبير. حلت 
محل نظرية نيوتن في الفيزياء. وبا مثل» أحدثت نظرية التطور لداروين تغييرا جذريا à‏ 
الفكر النظري للعلوم السولوجيةء كما تحدت امذاهب الدينيه في معتقدات النشوء والخلق. 
وفي كلتا الحالتينء فقد تمسّك بعض الناس بالطرق المتبعة في التفكير وتش بثوا بهاء في حين 
انتقل آخرون إلى الفكر الجديدء والذي سرعان ما أصبح الفكر ال مهيمن. وف بعض المجالات 
الأكادمية: هناك القليل من الأدلة على نماذج عاملة: لا سيما في العديد من العلوم الاجتماعية» 
ole Jia‏ الاجتماع والجغرافيا البشرية. حيث تم تطبيق مجموعة متنوعة من المناهج 
الفلسفية على سسيل JELI‏ الوضعبية (Positivism)‏ والظواهرية (Phenomenology)‏ 
والبنبوية (Structuralism)‏ وما بعد البنيوية ...(Poststructuralism)‏ وغيرهاء وقامت 
العديد من هذه المعس كرات النظرية بطرح آراء متعارضة بشأن أفضل السبل لفهم العام. 
وف مجالات أخرى: مثل العلوم» كان الاجتماع أكثر على وحدة المنهج العلمي المتبع» معززا 
باختبار الفرضيات للتحقق منها أو نفيها. وهذا لا يعني» مع «US‏ عدم تحول أو تغير 
الطريقة التي تعمل على تصوير ونشر المنهج العلمي بشكل دوريء ووجود بعض النظريات 
الا ف ts diss‏ ظواهر معينة: فالنظريات مكتن أن تختلف حول الظواهر 
ولكنها تشترك في نفس النهج الأوسع للمساعي العلمية. 

وقد بين جيم غراي «(Jim Gray)‏ على سبيل المثال LS)‏ هو مفصّل ف Hey et al.‏ 
2009( تطور العلوم من خلال أربعة نماذج» حيث أشار إلى أن النموذج الرابع ما زال في 
بداياته ولكن هو نتيجة لشورة المعلومات المنتشرة (انظر الجدول 8.1). وبخلاف طرح 
كوهن» تحدث التحولات ف النموذج ON‏ النموذج السائد ف العلم لا يمكنه تفسير بعض 
الظواهر ال معينة أو الإجابة عن الأسئلة الأساسية» ومن ثم تبرز المطالبة بإعادة صياغة 
أفكار جديدة: فتحولات غراي تأسست على التطورات الجارية ف أشكال البيانات وتطورات 
الأساليب التحليلية الجديدة. وسيستكشف هذا الفصل إلى أي مدى gl‏ وجود النموذج 
الرابع في العلوم: ü dis‏ مدى تقود ثورة السانات إلى نظريات معرفية بديلة في العلوم 
الإنسانية والعلوم الاجتماعية. وبالنظر إلى المراحل الأولية نسسا à‏ ثورة البيانات المنتشرة, 
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فرمما لن blis‏ بتباين الآراء حول تأثر البيانات الكبيرة» والبيانات الط مفتوحة» والبنى التحتية 
للبيانات» وتحليلات البيانات الجديدة على إنتاج نظريات d$ sa‏ جديدة» وسيستمر وجود 
مثل هذه التباين ف الاراء. ولكنء لا مجال للشك ف أن البيانات CII‏ والبيانات المفتوحةء 
والبنى التحتية للبيانات: وتحليلات البيانات الجديدة تطرح قضايا معرفية أساسية وذلك 
لأن استخلاص ال معلومات الصحيحة والمفيدة من طوفان السانات لا blus Aso‏ قضية فنية 
مكن التعامل معها من خلال حلول 4435 فحسب )2012 (Floridi‏ 

الجدول رقم ١(‏ - ^( 

نماذج العلم الأربعة 
"ape‏ 


الرابع | العلوم الاستكشافية | يتسم بكثافة البيانات» الاستكشاف | في الوقت الحالى 
الإحصاني والتنقيس عن البيانات 

.Hey et al. 2009 المصدر: تم التجميع من‎ 
:(The Fourth Paradigm in Science) النموذج الرابع للعلم‎ 

3 حين أن جيم غرای (Jim Gray)‏ تصور أن النموذج sl JI‏ في العلوم يتسم US.‏ 43 
البيانات واتساع المنهج العلمي المؤسسء إلا أن بعض العلماء الآخرين يرون أن البيانات 
الكبيرة أفسحت الطريق لبزوغ wa> pac‏ للفلسفة التجريبية (Empiricism)‏ حيث 
يمكن لحجم البيانات الذي تصحبه أساليب معينة أن يكشف عن الحقيقة الكامنة فيهاء وأن 
asas‏ البيانات من أن تتحدث عن نفسها وهي متحررة من النظرية. وقد اكتسبت وجهة 
النظر الأخيرة الاعتماديه خارج dol s TW SE OU za‏ داخل دوائر الأعمالء ولكن 
أفكارها تأصلت وتحدذرت JU! à‏ الجديد لعلوم السيانات والعلوم الأخرى. فكلا امنهجين 
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يوفران تحديا للمنهجية العلمية التقليدية إضافة إلى طرح نموذج بديل محتملء وفي هذا 


عودة ظهور الفلسفة التجريسة :(The Re-Emergence of Empiricism)‏ 
بالنسبة للبعضء فإن فلسفة النموذج الرابع هي ما أطلق عليه Brooks (2013 a)‏ 
«منهج البيانات» .(Data-ism)‏ وهو محاولة التقاط ü‏ شىء على شكل انات واستخلاص 
مستوى معين من التبصر منها: "فاي شيء يمكن قياسه يجب أن يتم قياسه... البيانات هي 
منظور شفاف وموثوق يسمح L‏ بتنقية العاطفية والأيدلوجية؛ إن البيانات ستساعدنا 
على فعل أشياء رائعة - مثل التنبؤ بالمستقبل". إن من شأن مثل هذه الادعاءات المتعلقة 
بالبيانات أن تعزز كثيرا من الدعايات بشأن البيانات الكبيرة داخل مجتمع الأعمالء ويتم 
التعبير عنها بشكل عام من خلال الصياغة التجريبية - التي يمكن لها من خلال الحجم 
الكافي للبيانات أن تعبر البيانات عن نفسها. disg‏ هذه الفلسفة التجريبية متضمنة بشكل 
TE^‏ في ادعاءات )2008( «Chris Anderson‏ وهو رئيس تحرير سابق ق مجلة وايرد 
(Wired)‏ والذي ضربت دعوته التأليبية ob‏ البيانات الكبيرة ما هي إلا مؤشر على "انتهاء 
AUI‏ 45 على وتر حساس للكثير من ال معلقين. لقد Anderson Sò‏ في مقطوعة استفزازية 
أن "طوفان البيانات يجعل المنهج العلمي Saga‏ وأن الأنمماط والعلاقات المتضمنة داخل 
البيانات الكبيرة تقدم بشكل متأصل معرفة iag‏ وثاقبة عن العمليات الاجتماعية: 
والسياسية: والاقتصاديةء والظواهر المعقدة. وقد أكد ذلك SGB‏ 
هناك الآن طريقة أفضل. فالبيتابايت تسمح لنا بأن نقول: "إن الارتباط كاف" 
.(Correlation is enough)‏ ومكننا أن نتوقف عن البحث عن النماذج. LS e‏ 
أيضا أن نحلل البيانات بدون أي افتراضات بشأن ما يمكن أن يظهره التحليل W‏ 
ويمكننا أن نرمي الأرقام في أكبر تجميعات الإحصاء التي شهدها العام يوماء وأن 
ندع الخوار زميات الإحصائية تجد الأنماط إذا كان العلم لا يستطيع إيجاد هذه 
الأماط... فالارتباط يحل محل السببية» ويمكن للعلم أن يتقدم ويتطور حتى 
بدون النماذج المترابطة أو النظريات الموحدة: أو أي تفسير ME‏ على الإطلاق. لذ 
لا يوجد أي سبب للتعلق بالطرق القديمة. 
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le‏ نحو cawl às‏ أكد )2009( Prensky‏ على أنه "لم يعد يتعين على العلماء الآن القيام 
بتخمينات تنم عن الثقافة» أو أن يقوموا بتأسيس افتراضات ونماذج» ويختبروا هذه الافتراضات 
وتلك النماذج من خلال التجارب والأمثلة المعتمدة ule‏ السبانات. فيدلا من «AUS‏ يمكنهم 
التنقيب ف ال مجموعة الكاملة من البيانات E‏ عن الأنماط التي 1A DS‏ التأثرات وتقده 
النتائج العلمية بدون إجراء أي تجريب إضافي". ومن ثم فلقد أكدت )2012( Dyche‏ أن: 
"التنقيب في البيانات الكبيرة يكشف العلاقات bY‏ التي لم نكن نعرفها كي نبحث عنها". 
واستمرت ف الادعاء قائلة: "هذه الأنماط محددة للغاية وتبدو وكأنه تم التحكم في تحديدها 
من خلال الافتراضات". وبالمثل: أكد )2013( Steadman‏ على ما «Ju‏ 


يتيح منهج البيانات الكبيرة تجاه gaz‏ المعلومات المبني على المعرفة للمحليين 
الحصول على القرار الكامل فيما يتعلق بالشئون ible‏ النظاق. فلا يتم فقد أي 
شيء عند النظر عن قرب بالغ إلى جزء واحد محدد من البيانات؟ ولا يتم فقد ü‏ 
شيء عند محاولة الحصول على منظور واسع للغاية بشأن موقف حيث تم فقدان 
التفاصيل الدقيقة. فالخوارزميات تجد JUI‏ في حين أن الافتراضات تتبع من 
البيانات» ولا يجب على المحلل أن يزعج نفسه حتى بطرح افتراض بعد الآن. لقد 
تحول دورها من دور استباقي إلى دور تفاعلي» حيث إن الخوارزميات هي من 
تقوم بالعمل السياقي... فالخوارزميات ستقوم بتحديد الأماط ثم تقوم بوضع 
النظريات» ولذا فهناك حاجة متناقصة للقلق بشأن وضع افتراض في البداية ثم 
اختبار هذا الافتراض من خلال عبنة من LUI‏ 
Sliv‏ 9,5« فيدلا فن اختباز إذا ما كانت يعض BUM‏ اللفترضة المعينة أو العلاقات 
توجد داخل مجموعة بيانات» فإن الخوارزميات مصممة للعمل على البيانات الكبيرة من 
أجل اكتشاف ارتباطات ذات دلالة بين البيانات دون أن يتم توجيهها من قبل الافتراضات. 
GS;‏ قال )2012:56( :Croll‏ "في النموذج القديم المتسم بندرة البيانات» كان يتعين علينا 
أن نقرر ما الذي ينبغي جمعه أولا ثم نقوم بجمعه. e^ Ll‏ النموذج الجديد المتسم بوفرة 
البيانات» فنحن نقوم بالجمع أولا ثم نسأل الأسئلة لاحقا". 
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إن الأمثلة المستخدمة ف توضيح مثل هذا الموقف عادة ما تكون نابعة من التسويق 
والتجزئة. فعلى سبيل «JULI‏ وصف )2012( Dyche‏ حالة سلسة تجزئة حيث قام بتحليل 
صفقات الشراء Bab‏ اثني عشر عاما من أجل ملاحظة العلاقات المحتملة غير الملحوظة بين 
المنتجات التي انتهى بها الأمر في سلة المشتريات للمتسوقين. وقد أدى اكتشاف الارتباطات 
بين البنود المعينة إلى تعيين الأماكن الملائمة للمنتج الجديد وإجراء بعض التعديلات على 
إدارة مساحة الأرفف مع زيادة تبلغ ZVT‏ في الإيرادات لكل حقيبة تسوق في الشهر التجريبي 
الأول. لم تكن هناك أي افتراضات بأن المنتج (س) على سبيل JELI‏ غالبا ما يتم شراؤه مع 
المنتج (ص) والتي تم اختبارها فيما بعد. لقد تم بكل بساطة طرح بعض التساؤلات بشأن 
البيانات من أجل اكتشاف ماهية العلاقات الموجودة التي لم يكن من الممكن ملاحظتها في 
السابق. وباممثلء فإن نظام التوصيات في موقع أمازون يقدم اقتراحات بشأن منتجات أخرى 
من الممكن Oso Ol‏ المتسوق مهتما بها دون معرفة أي eig‏ عن ثقافة als sl‏ الكتب 
والقراءة لذلك المتسوقء فهذا النظام يحدد. ببساظة: أنماط الشراء عبر العملاء وذلك من 
أجل تحديد ما إذا كان الشخص (س) يحب الكتاب (ص)» فمن ال محتمل أنه سوف يحب 
الكتاب (ز) وذلك بالنظر إلى الأنماط الاستهلاكية له وللآخرين. 


ويزعم Dyche‏ أن هذا امنهج امفتوح aliss W‏ بدلا من أن يكون موجهاء يعد asi‏ 
احتمالية لكشف الأنماط الضمنية غير المعروفة: وذلك فيما يتعلق بسلوكيات المستهلك. 
والعلاقة بين ال منتجات» والمخاطر AJU‏ والتى يمكن الاستفادة منها لاحقا. وف حين أن 
من ال ممكن أن يكون من ال مفضل توضيح أي ارتباطات موجودة داخل البيانات وما السبب 
في كون هذه الارتباطات ذات «JV»‏ فإن مثل هذا التفسير يعد غير ضروري بشكل (e$‏ 
فالمهم هو معرفة أنه يفعل ذلك. ومن ثم فلقد ادذعى )90 :2013( Siegel‏ (هذا هو 
تأكيدي) فيما يتعلق بالتحليلات التنبئية: "نحن في العادة لا نعرف عن السببية» ونحن في 
الغالب لا نهتم بذلك بالضرورة... إن الهدف يركز بشكل كبير على التنبؤ أكثر من تركيزه 
على فهم العام... إنه بحاجة إلى أن ينجح فحسب؛ إن التنبؤ يفوق التفسير". وكما ادعى 
Weinberger (2011: 33)‏ فيما يتعلق بهنش (Hunch)‏ وهو موقع شبی agi‏ بتقديم 
توصيات بناء على الإجابات عن الأسئلة التي يبدو أنها لا ترتبط ارتباطا ls‏ بالأسئلة 
الأصلية التي تم توجيهها: 
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إن التحليل لا يدعم النظرية وهو لا يقدم آي نظرية. لا توجد لدى موقع 
(Hunch) ¿a‏ أي فكرة b‏ أن الناس الذين» على سبل «JUI‏ يفضلون ارتداء 
صندل على الشاطئ والذين م يقوموا بنفح الهندباء (نبته بريه) في العام «sole‏ 
رما يحبون هذه الأفلام الأربعة (التي تم اقتراحها لهم). فالموقع لم يكن لديه آي 
افتراضء وم يكن لديه أي تخمين. كل ما كان لديه ارتباط إحصائي فحسب. 


إن بعض برامج تحليلات البيانات يتم بيعها من أجل هذا التصور بالضبطء فعلى 
سبيل JELI‏ فإن البعض يدعي أن برنامج التنقيب عن البيانات والعرض البصري آياسداي 
«(Ayasdi)‏ لديه القدرة على اكتشاف الرؤى بشكل الى بغض النظر عن التعقيد ودون 
توجيه أي أسئلة. ويمكن لعملاء آياسداي أن يتعلموا أخيرا الإجابات عن الأسئلة التى لم 
يكونوا يعرفون أن يسألوها في المقام الأول. ولعرض الأمر بصورة مبسطة: فإن آياسداي هو 
«سرنديبية رقمية» معنى أن آياسداى لديه القدرة على اكتشاف الأشياء ال مفيدة مصادفة 
(من أسطورة أمراء سرنديب الثلاثة)(2013 (Clark‏ وعلاوة على ذلك فهناك من يدعي أن 
آياسداي أزال بشكل JS‏ دور العنصر البشري في عملية التنقيب عن البيانات - ومن ثم 
فلقد آزال جميع التحيزات البشرية المتضمنة معه. ودلا من انتظار أن يتم توجيه سؤال 
al‏ أو أن يتم توجيهه إلى روابط Ollo‏ موجودة duse‏ فإن النظام سوف يقوم وبدون 
aos‏ باكتشاف الأنماط التي رما م يفكر المتحكم البشري أن يبحث عنها )2013 (Clark‏ 

إن هناك مجموعة قوية وجذابة من الأفكار التي تعمل في مثل هذه المجادلات والتي 
تجري على نحو متضاد مع المنهج الاستدلالي المسيطر وا مهيمن داخل العلوم الحديثة. Yal‏ 
أنه يمكن للبيانات الكبيرة أن تلتقط المجال بالكامل وأن تقدم 1,3 كاملا. ثانيا: أنه لا توجد 
هناك حاجة للنظرية: أو النماذج أو الافتراضات الاستنباطية. ثالثا: أنه من خلال تطبيق 
تحليلات البيانات بدون دراية يمكن للبيانات أن تتحدث عن نفسها وهي متحررة من 
الصياغة والانحياز البشريينء ols‏ أي أنماط أو علاقات داخل البيانات الكبيرة تكون صادقة 
وهادفة بشكل أصلى. د أن انى جاور السناق sl‏ المعرقة المرقطة Jis‏ 
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Gannon and Reid (2009)‏ أن "التوافر الجاهز في البيانات المتعددة يحول المناهج 
العلمية من الطريقة العلمية التقليدية التي تقودها الافتراضات إلى العلوم المعتمدة على 
الاستكشاف . وبامثل. يقترح )127 :2011( òl Weinberger‏ الهدف التقليدى للعلوم 
المتمثل في تكوين النظريات التي تدعمها الحقائق وتفسر الحقائق في الوقت ذاته يتحول 
في الوقت الراهن إلى "تقديم نماذج معقدة تفسر العلاقات المعكقدة" حيث "في بعض 
da cod‏ عن a‏ تخل كتفت قن ال تى ووا عل Mass EPET E.‏ من ads‏ 
هناك ارتباط قوي ملاحظ بين المحاكاة والعالم الحقيقي والذي هنح الثقة ob‏ المحاكاة 
الأخرى سوف تقدم نتائج موتوقة . وقد ستخدم JELI Weinberger‏ المتعلق بوضع 
عمود على بعد متر واحد أمام asl‏ الأبواب ف برنامج محاكاة لتدفق خروج الناس à‏ حال 
الإخلاء والذي أدى إلى تدفق أفضلء ولكن دون وجود أي تفسير من النموذج للسبب الذي 
يجعل العمود يفعل ذلك. واقترح. بطرق أخرى متعددة: أننا لسنا بحاجة OM‏ نعرف السبب» 
وإنما نحتاج لأن نعرف أن العمود Jei‏ ذلك olg‏ تطبيق الفكرة سوف يساعد على إنقاذ 
حياة الناس» وقد أنتج هذا ل )26 :2013( Andrejevic‏ حالة تسمى "المعرفة بدون الفهم". 


مغالطات الفلسفة التجريبية :(The Fallacies of Empiricism)‏ 
لا يوجد هناك أي شك بأن البيانات الكبيرة لديها. وسوف يكون لديها بشكل متزايد. 
تأثير على كيفية ممارسة وفهم العلوم. وعلى الرغم من ذلك فإن رؤية الفلسفة التجريبية 
بشأن كيفية تكون هذا العلم الجديد تعتمد على التفكير المغالط - جميع الأفكار الأربع 
التي تعزز تشكيلها مشكوك فيها. Le dà‏ تكون هذه الأفكار جاذبة بشكل كبيرء ولكن 
التدقيق النقدي والفلسفي يكشف مشاكل خطيرة مع كل فرضية. إن من المهم أن يتم 
التحقق من كل فكرة. كل بدروهاء قبل صياغة 4555 بديله للعلم الذي تقوده البيانات 

والذي مزج بين سمات الإبعادء والاستقراء والاستنتاج. 

أولا: يمكن للبيانات الكبيرة أن تلتق ط المجال بالكامل وآن تقدم قرارا Mals‏ حيث إن 
البيانات الكبيرة تكافح من أجل الشمولية» فمناصروها يدعون أنه من الممكن رؤية كل شيء 
داخل المجال (Ae)‏ سبيل امثال جميع الأنشطة على موقع تويتر أو جميع عمليات الشراء داخل 
سلاسل امتاجر الكبيرة)ء وأنه من الممكن أن نفهم بشكل كامل ما نراه )2013 Jes (Vis‏ 
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الرغم من ذلكء وكما ناقشنا في الفصول Ys ١‏ و فإن البيانات الكبيرة رما تسعى إلى أن تكون 
شمولية» ولكنها تشكل كلا من التمثيل والعينة. فالواقع» أن جميع البيانات تقدم رؤى بصرية 
قليله للعام» وليس رؤى شاملة: أي رؤى من وجهات نظر duso‏ باستخدام أدوات معينة. 
وذلك بدلا من رؤى بصرية شامله Y‏ تخطئ )2002 (Haraway 1991; Amin and Thrift‏ 
وعلاوة على ذلك فإن المجالات تتطور وتتغيرء ومن ثم فإن البيانات الكبيرة ليس بإمكانها 
الوصول إلى كل مكانء وذلك يرجع من ناحية إلى أن البيانات الكبيرة لا يمكنها الإلمام بجميع 
الأماكن والأزمنة» ومن ناحية أخرى؛ فإن الكثير من الأماكن والأزمنة الجديدة تبقى لكي يتم 
اختراعها )128 :2002 (Amin and Thrift‏ وعلى هذا النحوء تشكل البيانات الكييرة "سلسلة 
من الأوامر الجزئية والكليات المتمركزة, مع مقدرتها على التحديق في بعض الاتجاهات Ug»‏ عن 
الآخر ى Latour)‏ والمقتبس في 92 :2002 (Amin and Thrift‏ ومن ثم فلقد استنتج Vis)‏ 
3 "آنه من المهم أن نتذكر أن ما نراه تتم صياغته من قبل ما نحن قادرون على رؤيته أو 
في الواقع ما نريد رؤيته من خلال إطار عمل فكري محدد . 

ثانيا: أنه لا توجد هناك حاجة للنظرية» أو النماذج: أو الافتراضات الاستنباطية. الافتراض 
هنا هو أن تكوين البيانات وتحليلات البيانات واللذان يعززان استخدام البيانات الكبيرة 
يبدو أنهما يأتيان من لا شيء» وأنهما بشكل ما متحرران من "القوة التنظيمية للفلسفة" 
.(Berry 2011: 8)‏ فالأنظمة المتناقضة تصمم من أجل التقاط duszo elg]‏ من الساناتء 
i‏ ما يحصل ذلك من أجل أغراض محددة ill‏ وآن التحليلات والخوارزميات yW‏ 
تدعمان البيانات الكبيرة تعتمدان على الاستدلال العلمي وأنه تم صقلها من خلال الاختبار 
العلمي. فالعديد من الأفكار المستخدمة في تصميم نظم البيانات الكبيرة مستمدة من 
الأدبيات العلمية واسعة النطاق والتجارب وا معارف لهؤلاء الذين يعملون على النظام. 
إن هناك الكثير من الوقت ال مستنفد فى اختيار واختبار طرق متعددة لتحديد واستخلاص 
القيمة من السانات Asl‏ وتقييم النتائج وتطويع التحليلات. وهناك جدول أعمال 
يقود مثل هذا العمل وذلك فيما يتعلق ماهية النتائج المرجوة (زيادة دوران رأس JUI‏ أو 
الأرباح» أو فهم نظام معينء eJ]‏ والذي يستفيد من النظريات المبرهنة. وذلك فيما يتعلق 
ماهية الطرق ال ملحوظة لتحقيق مثل هذه التأثرات» وما إذا كانت Jis‏ هذه التأثيرات 
تحدث ف الواقع ثم يتم اختبارها بعد ذلك. 
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وكما أشار )2012( Leonelli‏ فإن الإستراتيجية الاستقرائية لتحديد الأنماط داخل 
البيانات عادة ما يقودها الاستدلال العلميء وهي لا تحدث فراغا علميًا. أوء كما ذكر 
Quintero (2012)‏ "لا مكن تقديم التفسيرات ببساطة من التحليلات الإحصائية. وذلك 
دون الحاحة إلى نظرية dilu‏ من نوع ما . وقد اتبع ذلك قائلا: "كونك منقادا بالسانات 
يعد أمرا مفيدا فحسب إذا كان لديك نظرية قوية يمكنك من خلالها أن تستمر في طريقك. 
ان أي شىء اخر سوف يتركك متجها Al‏ منحدر دون أن تراه". göl‏ أن كلا من الاستدلال 
الاستنتاجي والاستقرالي يتم تشكيلهما Lois‏ بشكل استطرادی ولا Liu‏ أحدهما من لا 
شيء. ومن ثم فقد اقترح )1979( Popper‏ مقتىس من )74 :2012( Callebaut‏ أن 
جميع العلوم تطبق منهج الأضواء الكاشفة على الاكتشاف العلميء حيث يكون تركيز 
الضوء Ga llä‏ خلال النتائج السابقة والنظريات والتدريب» WIS‏ من :خلال التخمين 
المؤسس على التجارب وال معارف. إن الأمر alò‏ ينطبق على أمازون (Amazon)‏ وهنش 
(Hunch)‏ واياسداي (Ayasdi)‏ وجوجل (Google)‏ فالكيفية التي اعتمد lyde‏ أمازن 
في بناء نظام التوصيات على الاستدلال المنطقي» كانت معززة من خلال نموذج إرشادي 
يرافقه اختبار تجريبي تم تصميمه من أجل تحسين slol‏ الخوارزميات التي يستخدمها. 
bbg‏ فإن جوجل يقوم ببحوث وتطوير واسع النطاق» وهو يعمل بالشراكة مع العلماء 
ويشتري ال معرفة العلمية» سواء تم هذا من خلال تمويل البحوث داخل الجامعات أو من 
خلال شراء ا معرفات الإلكترونية للشركات VI‏ 45,2 وذلك من أجل تنقية وتوسيع ال منفعة 
بشآن كيفية تنظيمه» وتقدهه» واستخلاصه للقيمة من البيانات. ونتيجة UU‏ فإذا وجدت 
الخوارزميات ol «LUI à bli 4S Lazy‏ ذلك يعود إلى أنه تم استخدام علم التعرف 
على الأنماطء Lio‏ إلى جنب مع ال معرفة الخاصة بالمجال. 

ثالثا: مكن للسانات أن تتحدث عن نفسها وهی متحررة من الصياغة والانحياز البشريين. 
إن ال مفهوم القائل ob‏ إنتاج المعرفة من البيانات الكبيرة يحدث بشكل غير مرتبط بالعلم: 
هو على علاقة بالفكرة القائلة ob‏ تحليلات البيانات الكبيرة تمكن البيانات من التحدث عن 
نفسهاء وهي غير مثقلة بالسياقية أو أهواء التوضيح البشري. فليس فقط إنتاج البيانات 
هو ما يتم بشكل افتراضي ومتحرر من النظريه»ء فحتى تفسير ومعاني تلك البيانات يمكن 
بطريقة مشابهة أن يحدث في فراغ علمي» فمثل هذا المفهوم يعد سمة من سمات التفكير 
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التجريبي» وهو أنه عندما يتم تقديم وتحليل البيانات بطريقة AE‏ فإن البيانات» بنفسها 
ومن نفسهاء تشكل ذلا ملحا Jays‏ يظاهرة |9 عة Nas dime‏ مق dt ndi‏ وق حالة 
البيانات الكبيرة. فإن حجم السانات يضيف إلى أهمية الدليل. فهذا "التقديس" للسبانات 
Vu‏ أن يؤديء كما ادعى )2013( Jenkins‏ إلى حتمية السيانات OL ZSULI à‏ التى تتم 
من أجل البيانات الكبيرة. وهذا يعني أن البيانات تتفوق على النظرية» وأن البيانات أمر 
حقيقيء في حين أن النظرية ليست حقيقية )2013 (Hales‏ وأن البيانات تقول الحقيقة في 
حين أن النظرية مجرد تلفيق. وهناء يوجد ثلاث قضايا يتعين التفكير فيها: القضية الأولى 
هي افتراض أن البيانات موضوعية» ومحايدةء ومتحررة من التحيز البشري. القضية الثانية 
أن الأماط والعلاقات داخل البيانات الكبيرة هادفة وصادقة بشكل متأصل. القضية الثالثة 
أن تفسير مثل تلك الأنماط والعلاقات يفتقر إلى آي نوع من الوضعية والموقعية. 

وكما ناقشنا فى الفصل الأول فإن البيانات ليست ببساطة polis‏ محايدة أو طبيعية 
بحيث يتم فصلها عن العام بطرق محايدة وموضوعية: ويمكن قبولها بالقيمة الاسمية. 
فالبيانات لا توجد قبل تكوينها ولا تنشأ من آي شيء. ولكن الأحرىء أن البيانات يتم إنشاؤها 
داخل مجاميع البيانات المعقدة التي تشكل تركيبها بشكل فعالء ولا يمكن للبيانات في هذه 
الحالة التحدث عن نفسهاء ولكنها على الدوام تتحدث» بشكل holis‏ من وضعية معينة 
(Crawford 2013)‏ وعلاوة على 43« فإن ادعاء )2008( ob Anderson‏ الارتباط يفوق 
السببية يشير إلى أن الأنماط الموجودة داخل مجموعة البيانات ذات معنى بشكل متأصل. 
وهذا افتراض يعرف جميع الإحصائيون ال مدربون أنه خطر وغير صحيح. فالارتباطات بين 
المتغيرات داخل مجموعة البيانات يمكن أن تكون عشوائية بطبيعتها ويوجد بينها ارتباط 
عرضي قليل» أو لا يوجد هذا الارتباط على الإطلاق (انظر الفصل التاسع). إن تفسير أي 
ارتباط على أنه ذو مغزى رما يؤدي 3( هذه الحالة إلى مغالطات iato‏ خطيرة. ويمكن أن 
يتفاقم هذا الأمر في حالة البيانات الكبيرة» وذلك يرجع إلى كون ال موقف التجريبي يظهر 
وكأنه يعزز ممارسة تجريف البيانات - البحث عن أي ارتباط - ومن ثم يزيد من احتمالية 
اكتشاف ارتباطات عشوائية. وعلى الرغم من «US‏ ففي حن أن التعرف على الأماط 
رما يحدد علاقات شيقة محتملة: إلا أن صحة هذا الأمر تستلزم اختباره على مجموعات 
بيانات أخرى وذلك من أجل التأكد من مصداقيتها وصحتها. وبعبارة أخرىء يتعين أن 
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تشكل العلاقات أساس الافتراضات التي يتم اختبارها على نطاق أوسع: والتي تستخدم بعد 
ذلك من أجل بناء وصقل النظرية التي تفسرهاء ومن ثم فإن الارتباطات لا تفوق السببية: 
ولكنها بالأحرى يجب أن تشكل أساس بحوث إضافية من أجل معرفة ما إذا كانت مثل 
هذه الارتباطات دالة على السببية: وق هذه الحالة فقط يممكننا أن ندرك مدى مغزى أسباب 
الارتباط. 

وفي حين أن الفكرة القائلة ob‏ البيانات تتحدث عن نفسها وهي متحررة من التحيزات 
أو أن الصياغة رها تبدو وكأنها فكرة جاذبة: إلا أن الواقع مختلف إلى حد ما. فبحسب ما 
أشار )166 :1981( Gould‏ فإن "البيانات غير الحية لا مكنها أبدا أن تتحدث عن نفسهاء 
ونحن lass‏ نحاول أن نوجه بعض إطار العمل المفاهيميء سواءٌ كان بديهيا ومشكلا بصورة 
سيئة» أم US a‏ بشكل محكم ومنهجي» نحو مهمة الاستقصاء والتحليل» والتفسير". إن 
فهم البيانات lago‏ مؤطر؛ ويتم فحصها من خلال منظور معين يصوغ كيف تتم ترجمتها. 
وحتى لو كانت العملية مؤتمتة بطريقة do‏ فإن الخوارزميات المستخدمة لمعالجة bU JI‏ 
عادة ما تكون متشبعة بقيم معينة وتكون مقترنة بالسياق داخل منهج علمي معين. 
وكما أوضح )2013( olè :Hales‏ "أي اختبار إحصائي أو خوارزمية تعلم آل تعبر عن 
منظور ماهية النمط أو النظام... فأحد الخوارزميات ,س وف تجد نمطا da‏ في جين تجد 
خوارزمية أخرى شيئا آخر". فإذا ترجم ذاك شخص ماء فسيكون من المحتم أن يستفيد 
من معرفته» ومهاراته» وحذسه المتراكم من أجل تنقية رؤاه. حتى يقوم محلل مختلف 
بطرح نتائج مختلفة من نفس التحليلات. فالفهم أو التفسير يتشكل ف العادة من خلال 
أعين المشاهدين بغض النظر عن ادعائهم أنهم محايدون أو متحررون من القيمة الناتجة 
وعلاوة على ذلك» فإن التفسيرات ليست ثابتةء فهي تتغير كلما تعرضت إلى معارف جديدة 
من خلال «soo‏ أو مناقشات: أو مجادلات إضافية. وعلى dis‏ فإن السانات لا تتحدث 
عن نفسها daf‏ وكما ادعى )9 :2012( Silver‏ "نحن نتحدث LJL‏ عن السانات". 

رابعا: المعنى يتجاوز السياق أو المعرفة المرتبطة با مجال. إن من الجوانب المرتبطة 
بالفكرة القائلة gb‏ البيانات تتحدث عن نفسه المفهوم القائل بأن تفسير البيانات الكبيرة 
لا يتطلب معرفة سياقية أو مرتبطة بمجال معين. وبدلا من ذلك» فالمهم هو المقدرة على 
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توضيح (isl‏ داخل البيانات» فبسبب أن البيانات من المفترض أن تتحدث عن نفسهاء 
مكن لأى شخص ذو فهم معقول بالإحصاء أن يكون قادراً على تفسيرها. إن هناك شكوكا 
قليلة فيما يتعلق بأن علماء البيانات والحاسب والعلماء الآخرين يتحركون داخل نطاق 
تخصصات بعضهم البعض مع انتشار البنى التحتية للبيانات والحوسبة. وف الكثير من 
الحالات» فإنهم لا يقدمون آدوات جديدة فحسب» ولكنهم يشتركون dlei‏ في تفسير 
البيانات. ومع ذلك» فإن هؤلاء العلماء لديهم القليل من الفهم المعمق ف المجال المناط بهم 
وكذلك بالنظريات التجريبية المتعمقة وا معارف التي تم تأسيسها عبر فترات زمنية طويلة. 
فعلى سبيل JEBI‏ فيما يتعلق بالعلوم الاجتماعية والإنسانية: فإن الأساليب الجديدة من 
التحليلات والبنى التحتية للبيانات توجه من قبل علماء الحاسب والفيزياء. وفي الغالب 
تجعل النتائج أولئك المتشربين لوجهة النظر التخصصية يستسلمون وينقادون لهذه النتائج. 

ولتوضيح هذا الجانب» فإن المجال الناشئ للفيزياء الاجتماعية. والذي من خلاله يقوم 
الفيزيائيون وآخرون باتخاذ قرارات olio‏ العمليات الاجتماعية وال مكانية slo‏ على تحليلات 
البياننات الكبيرة. وخاصة تلك المتعلقة gabh‏ والقوانين المفترضة التي تعزز صياغتها 
ووظائفها )2013 Jolan La LJe «(Bettencourt et al. 2007;Lehrer 2010; Lohr‏ 
عن عمد ثقافة ele‏ الاجتماع ال ممتد لقرنين من الزمان. ويشمل ذلك تجاهل التحليلات 
الكمية والنماذج اطبنية u‏ يقارب قرنا من الزمان. والنتيجة هي تحليل ال مدن الذي يكون 
توالا إل هد siis «uS‏ ويتجاهل كأثيرات الققافة. والسياسنة: واتحوكمة #راس «JU‏ 
وتقاليد ثرية من العمل الذي سعى نحو فهم كيفية عمل امدن من النواحي الاجتماعية؛ 
والثقافية» والسياسية: والاقتصادية والنتيجة إعادة إنتاج الأنواع ذاتها من أوجه القصور التي 
أوجدتها العلوم الاجتماعية الكمية / الوضعية في منتصف القرن العشرين );2914 Kitchin‏ 
liss .(Mattern 2013‏ ايضا يتعدى حدود التقاليد المتنوعة والثريه 3 الفلسفي 
ويعمل على تعزيز المناهج الفلسفية التجريبية والوضعية بصفتها أفضل وسيلة لفهم ال مدن 
مع eol‏ مق eati‏ آلا يتفق مع هذه JI‏ 453 النظرية إلا القليل lao‏ من العلوم الاجتماعية 
التي تلت pas‏ الفلسفة الوضعية )2013 (Kitchin‏ 
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إن هناك مجموعة متشابهة من ال مخاوف لدى أولئك العاملين في مجال العلوم. 
فقد أشار )2012( Strasser‏ على JUI Je‏ إلى أنه في العلوم البيولوجية: ادعى 
متخصصو المعلوماتية الحيوية الذين لديهم أسلوب معين وضيق للغاية لفهم علم 
«Le MI‏ أن الأرض كان يسكنها في السابق الأطباء السريريون وعلماء الأحياء التجريبيون 
والجزيئيون. وأشار إلى آن: "تحويل التحليل إلى البيانات الرقمية... يفسح المجال أمام 
الأسئلة المعرفية كتلك المتعلقة من هلك الشرعية ليكون منتجا للمعرفة- المهتم بالآثار 
sl)‏ الطبيب السريري أو عام البيولوجيا الجزيئية) أو الإحصان الذي يحلل البيانات 
ويقدم المحاكاة أو النموذج (2012: 7). ومن ثم فإن بعض علماء البيانات بدون شك 
بتجاهلون ملاحظات )2013( «Porway‏ وهى: 


بدون توافر خبراء في موضوع البحث من أجل توضيح المشاكل مسبقاء فسوف 

نحصل على نتائج ضعيفة... وبدون شك فإن هناك حاجة إلى خبراء في موضوع 

البحث من أجل تقييم نتائج العمل وخاصة عندما يتعامل الفرد مع بيانات حساسة 

عن السلوك البشري. وبوصفنا علماء بيانات» فنحن مؤهلون Sis‏ جيد للتعامل 

مع "ISL"‏ فيما يتعلق بالبيانات» ولكن لا يجب علينا إلا فيما ندر التعامل مع سؤال 

"ISU"‏ فيما يتعلق با موضوعات التي لا نكون خبراء فيها. 

وكما أشار .Porway‏ فإن المطلوب deilb‏ هو أن يعمل علماء البيانات وخراء 
النطاق مع بعضهم البعض من أجل التأكد من أن تحليلات البيانات المستخدمة مفهومة 
olg‏ النتائج من مثل هذه التحليلات يتم تفسيرها بعقلانية وسياقية. «Jibbs‏ يدعو 
Lazer et al. (2009: 10 - 11)‏ إلى التعاون بين elle‏ الاجتماع الضالعين إحصائيا وبين 
css ES TEER elle‏ عاونا (91-1053009)دفييا «Jis (alezs‏ جى 
Minelli et al. (2013)‏ !5 فرق علماء السانات ينبغي أن يعملوا مع sly‏ عمليات 
الأغمال هن Jal‏ الاستفادة من الرؤى التاسة (انظر Lal‏ الحدول (8-Y‏ 


العلم المقاد بالسانات :(Data-driven Science)‏ 
يسعى العلم المقاد بالبيانات» بدلا من كونه متجذراً في الفلسفة التجريبيةء إلى التمسك 
معتقدات الطريقة العلمية» ولكنه أكثر انفتاحا لاستخدام gujo‏ مختلط من المناهج 
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الاستدلاليةء والاستقرائية» والاستنتاجيةء من أجل تطوير فهم الظاهرة. liag‏ يختلف عن 
التصميم الاستدلالي التجريبي التقليدي في أنه يسعى إلى طرح افتراضات ورؤى يتم توليدها 
من السانات بدلا من تولبدها من النظريات )613 :2009 .(Kelling et al.‏ ويعبارة 
POR:‏ فهو يسعى إلى دمج أسلوب من الاستقراء في تصميم البحوث» وذلك على الرغم 

ól cya‏ الشرح من خلال الاستقراء ليس هو Dll‏ المستهدفه LS)‏ هى الحال مع امناهج 
التجحرسة). وبدلا من ذلك. فهو يشكل Te bu]‏ من أسالبب توليد الفرضيات قبل 
استخدام ال منهج الاستنتاجي. ولا تنشأ dlas‏ الاستقراء من لا شىء ولكنها تقع وتقترن 
بسياق نطاق نظري متطور للغاية. ومن (e‏ فإن الإستراتيجية ال معرفية المتبناة داخل العلم 
المقاد بالبيانات هي استخدام أساليب موجهة لاكتشاف المعرفة من أجل تحديد الأسئلة 
(الافتراضات) ال محتملة الجديرة باختبارات وبحوث إضافة. 


فالعملية يتم توجيهها من ناحية أن النظرية الحالية تستخدم من أجل توجيه عملية 
اكتشاف المعرفةء وذلك بدلا من أن Jab‏ سساطة أن نحدد جميع العلاقات داخل مجموعة 
البيانات وأن نفترض أنها ذات معنى بطريقة أو بأخرى. ومن ثم فإن كيفية تكوين 
البيانات أو إعادة تحديد الغرض Lgu‏ تقوده افتراضات معينة تعززها خيرات ومعارف 
عملية Jio «o ss‏ ما إذا كانت التقنيات وإعدادها سوف تلتقط أو تنتج مواد بحثية 
مفيدة وملائمة. فبدلا من إنتاج البيانات بأي dl. us‏ ممكنة: وذلك باستخداة أي نوع من 
التقنبات المتاحة أو أي نوع من آطر التمثيل. يتم التفكير بعناية في إستراتيجيات تكوين 
البيانات وإعادة توظيفهاء مع اتخاذ قرارات إستراتيجية من شأنها أن تؤدي إلى أنواع معينة 
من البيانات. وعلى نحو مشابه» يتم توجيه كيفيه dales‏ وإدارة وتحليل هذه البيانات 
من خلال الافتراضات المتعلقة بماهية الأساليب التي رها توفر رؤى هادفة. فالبيانات لا 
مكن إخضاعها لأى صباغة 55929 ممكنة» ولا مكن إخضاعها كذلك sY‏ نوع من أساليب 
cas‏ عن Ml Jal e «oL‏ رجا ككف عض الحقائق Mag. AAA‏ من «MUS‏ 
يتم اتخاذ القرارات المبنية على النظرية olis‏ الطريقة الأمثل للتعامل مع مجموعة البيانات 
Ers‏ يمكنها أن تكشف المعلومات التى رما تحمل فائدة محتملة وتكون جديرة سبحوث 
إضافية. وددلا من jusl‏ صحة أي علاقة يتم كشفهاء فإن الاهتمام يتركز على تلك العلاقات 
tlu-‏ على بعض lall‏ - التي يبدو أنها تؤدي إلى المسار الصحيح أو من ال محتمل بشكل 
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أكبر أن تؤدي إلى المسار الصحيح. وف الواقع» فإن الكثير من العلاقات ال مفترضة داخل 
مجموعات البيانات يمكن تنحيتها على أنها تافهة أو سخيفة من قبل متخصصي ال مجالء في 
حين يتم وسم البعض الآخر على uil‏ تستحق اهتماما إضافيا )2010 (H.J. Miller‏ 

إن مثل عملية اتخاذ القرار هذه فيما يتعلق بطرق توليد البيانات والتحليل تعتمد على 
التفكير الاستدلالي. والاستدلال هو وسيلة للاستنتاج والتفكير المنطقي تم وضعه بواسطة 
.(C.S. Peirce (1839 - 1914) (H.J. Miller 0‏ ويهدف الاستدلال الى خاتمة تكون 
ذات معنى منطقي ومعقولء ولكنها ليست حاسمة في ادعاءاتها. فعلى سبيل JELI‏ لا 
توجد أي محاولة لاستنتاج ما هي أفضل طريقة لتوليد البيانات» ولكن يمكن بدلا من ذلك 
تحديد طريقة ذات معنى منطقي بالنظر إلى ما هو معروف بالفعل عن إنتاج مثل هذه 
البيانات. ويستخدم الاستدلال بشكل شائع في العلوم وخاصة في تشكيل الافتراضات» على 
الرغم من أن مثل هذا الاستخدام غير معترف به على نطاق واسع. ولذاء فإن أي علاقات 
يتم كشفها داخل البيانات لا تنشأ من لا شيء: ولا تتحدث عن نفسها ببساطة كذلك. إن 
عملية الاستقراء - للرؤى الناشئة من البيانات - تتم صياغتها بشكل سياقي. وهذه الرؤى 
يست doli‏ مظاف الاستقصاء. ]5 يكم 5 ا وتفسيرها من خلال نظرية ها وندلا من 
ذلك: فإن الرؤى توفر الأساس لتشكيل الافتراضات والاختبار الاستنتاجي لصحتها. وبعبارة 
5,21« يعد العلم المقاد بالبيانات نسخة معاد تشكيلها من الطريقة العلمية التقليدية: مما 
يوفر وسيلة جديدة لبناء نظرية»ء وإضافة إلى ذلكء فإن التغيير المعرفي هو هادف بحد ذاته. 


ويدعي البعض أن العلم المقاد بالبيانات سوف يصبح gògail‏ الجديد للطريقة العلمية 
في عصر البيانات الكبيرة والمتدرجة ON‏ التفضيل ا معرف يتناسب مع استخلاص رؤى إضافية 
وقيمة سيفشل العلم التقليدى المقاد با معرفة في توليدها Kelling et al. 2009; H.J)‏ 
.(Miller 2012; Loikides 2010‏ إن العلم امقاد باطمعرفةء عند استخدامه منهج استنتاجی 
مباشرء له 6.58 معينة في فهم وتفسير العام تحت ظروف البيانات النادرة والحوسبة 
الضعيفة: ولكن الاستمرار في استخدام Jis‏ هذا النهج لا يبدو أنه مفهوم بشكل AS‏ 
عندما تشر التطورات التقنية والمنهجية إلى أنه من الممكن الاضطلاع بتحليلات أكثر ثراء 
للبيانات - تطبيق تحليلات جديدة للبيانات وتوفر القدرة على ربط بيانات كبيرة ومتفاوتة 
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ا بطرق كانت غير ممكنة لوقت قريب» والتى تقدم بيانات جديدة قيمة - والتحديد 
والتعامل مع الأسئلة بطرق جديدة ومؤثرة. فالعلم المقاد بالبيانات» بحسب ما يتم «LAUS‏ 
يتناسب أكثر مع استكشاف واستخلاص القيمة وفهم مجموعات البيانات الهائلة والمترابطة, 
وتعزيز البحوث متعددة الاختصاصات التي تدمج خبرات المجال من خلال الإطار النظري 
الاستهلالي كونها أقل محدودية» وسوف تؤدي إلى نماذج ونظريات أكثر شمولية وعمومية 
للأنظمة المعقدة بالكامل بدلا من عناصر منها )2009 (Kelling et al.‏ 

فعلى سبيل المثالء يدعي البعض أن العلم المقاد بالبيانات سوف يحول فهمنا عن 
الأنظمة البيئية )2009 .(Bryantetal. 2008; Lehning et al.‏ وسوف يتيح إمكانية 
التكامل بين بيانات آنية ولحظية وعالية الدقة وذلك في سبيل تقديم نماذج تفصيلية للبيئة 
المتغيرة على النحو الذي يتعارض مع blä‏ ثابتة غير متغيرة عبر المكان والزمان. ويقصد 
هنا التكامل بين البيانات التي يتم توليدها من العديد من المصادر كمحطات الطقس 
التقليدية والمتحركة: والأقمار الصناعية والتصوير الجويء ورادارات الطقس. ومحطات رصد 
التيارء ومحطات القياس» وملاحظات المواطنين: والاستشعار الجوي واختبار جودة المياه 
ومقايبس الغاز» وفحص التربة» والحساسات الموزعة التي تقيس الظواهر ال مختارة مثل 
درجة الحرارة والرطوبة. ومن شأن ذلك التكامل أن يسهم فى تحديد العلاقات الخاصة 
بين الظواهر والعمليات التي تولد افتراضات ونظريات جديدة هكن اختبارها بعد ذلك 
من أجل التحقق من صحتها. وهذا سوف يساعد أيضا على تحديد وفهم ثقاط الربط 
بين مجالات بيئية مختلفة مثل الغلاف الجوي (الجو)ء والغلاف الحيوي (الأنظمة (iil‏ 
والغلاف المائي (أنظمة المياه). والقشرة الأرضية (القشرة الصخرية (AU‏ والغلاف الترابي 
(äl)‏ والمساعدة على دمج النظريات في مجاميع نظرية Sl‏ شمولية. ومن شأن هذا 
أن يوفر فهما أفضل للعمليات المترابطة والمتنوعة في أرض الواقع والعلاقات الترابطية بينها 
وبين الأنظمة البشرية» ويمكن استخدامه كذلك من أجل توجيه النماذج وال محاكاة من أجل 
التنبؤ بالاتجاهات طويله المدى والإستراتيجيات التكيفية امممكنه. 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها vé‏ 





NZ 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الثامن 


العلوم الاجتماعية الحاسوبية والعلوم الإنسانية الرقمية 
(Computational Social Sciences and Digital Humanities)‏ : 

في حين أن معرفية العلم المقاد بالبيانات تبدو كما لو كانت وضعت لتحويل منهج 
البحث المطبق في العلوم المادية» والطبيعيةء والحياتية» والهندسية» إلا أن مسارها في العلوم 
الاجتماعية والإنسانية يبدو أقل تأكيدا. فهذه المجالات من العلوم متنوعة بشكل كبير في 
أسسها Aå uli)‏ وخاصة مع قيام عدد قليل فقط من العلماء في هذه المجالات بتوظيف 
ا معرفة المشتركة بين العلوم. فهؤلاء الذين ييستخدمون الطريقة العلمية من أجل تفسير 
ونمذجة الظواهر الاجتماعيةء بشكل cele‏ يستفيدون من أفكار الفلسفة الوضعية de)‏ 
الرغم من انهم رما لا يستخدمون مثل هذا العنوان. 2006 (Kitchen‏ ومثل هذا العمل 
ميل إلى التركيز على المعلومات الواقعية والكمية - الظواهر المشاهدة تجريبيا والتي يمكن 
قياسها بشكل فعال كالأعداد والمسافات والتكلفة والوقت على النحو الذي يتعارض مع 
المجالات الأكثر Dol‏ من الحياة الإنسانية مثل المعتقدات والآيدولوجيات - باستخدام 
الاختبار Las VI!‏ من أجل تأسيس علاقات سببية وبناء النظريات والنماذج التنبئية 
وامحاكات. فامطناهج الوضعية مؤسسة بشكل جيد ف الاقتصاديات» والعلوم السياسية؛ 
والجغرافيا البشرية» وعلم plazo VI‏ ولكنها نادرة بشكل uS‏ في العلوم الإنسانية. deg‏ 
الرغم من ذلكء فداخل هذه التخصصات المذكورة» كانت هناك حركة قوية خلال Aal‏ 
الأخير من القرن اماضي تجاه المناهج ما بعد الوضعية؛ وخاصة في الجغرافيا البشرية وعلم 
الاجتماع. 

وفيما يتعلق بعلماء الوضعية في العلوم الاجتماعية» فإن البنى التحتية OLL‏ والبيانات 
امفتوحة OLL lg‏ الكييرة توفر فرصا هائلة من أجل تطوير تماذج اك تطورا وأكثر دقة å‏ وعلى 
نطاق واسع للحياة الإنسانية. فثورة البيانات توفر إمكانية الانتقال من دراسات ال مجتمعات 
التي تتسم بالندرة في البيانات إلى الدراسات الثرية في البيانات» ومن اللقطات الثابتة إلى 
الانتشار الديناميكي» ومن | التجميعات الرديئة إلى الدقة العاليةء ومن النماذج البسيطة نسبيا 
إلى محاكاة أكثر TE E‏ وتطورا )2013 (Kitchen‏ إن هناك احتمالية لعصر جديد من 
العلوم الاجتماعية الحاسوبية التي 5,25( دراسات ذات اتساع» وعمق» ومدى. وإطار ES‏ 
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أكبر بكثيرء وهي تغطي فترات زمنية متعددة بشكل متأصلء وذلك على النقيض من بحوث 
العلوم الاجتماعية الحالية )2012 (Lazer et al. 2009; Batty et al.‏ وعلاوة على ذلك 
فإن حجم» وصحة» 939« وشمولية» 853 وارتباطية» 33,23« وتوسعية البيانات» بالإضافة 
إلى القوة المتزايدة للحوسبة وتحليلات البيانات dyad‏ تتعامل مع بعض انتقادات slde‏ 
الوضعية حتى اليوم, oU‏ تلك المتعلقة بالاختزالية والشموليةء وذلك من خلال تقديم 
تحلئلات أكثر دقة وحساسة (sls‏ يمكنها أن تهتم بالسياق والاحتماليةء ويمكن استخدامها 
من أجل صقل وتوسيع الفهم النظري للعام الاجتماعي المكاني. وعلاوة على US‏ وبالنظر 
إلى شمولية البيانات» فمن الممكن اختبار صحة مثل هذه النظرية عبر العديد من المواقف 
والبيتات. وف مثل هذه JI‏ 5« فإن المعرفة عن الأفراد. والمجتمعات. والجماعات: 
والبيئات سسوف JS] pues‏ تبصرا ونفعا وذلك فيما يتعلق بصياغة à ull‏ والتعامل مع 
القضايا المتعددة التي تواجه البشرية. إن التحدي الكامن في مثل هذا السيناريو لم يعد هو 
البيانات» ولكن تأسيس طرق إحصائية ونمذجة جديدة لها المقدرة على التعامل مع ملايين 
أو oo‏ لمشاهدات )2012 (Batty et al.‏ 

وبالنسبة لعلماء ما بعد الوضعيةء فإن ثورة البيانات المنتشرة توفر كلا من الفرص 
والتحديات. فالفرص تتمثل في رقمنة وربط البيانات التناظرية وغير المنظمة» والتي يُعد 
الكثير منها جديدا كوسائل التواضل الاجتماعي» والكثير lazo‏ كان من الصعب الوصول 
إليها في السابق كملايين الكتب» وال مستندات. والصحفء. والصورء والأعمال الفنيةء والأشياء 
المادية... إلخ من عبر التاريخ والتي تم تحويلها إلى الصيغة الرقمية خلال العقدين السابقين 
من خلال مجموعة من المنظمات) )2008 (Cohen‏ واتاحة ادوات حديدة لمعالجة وادارة 
وتحليل البيانات؛ وتوفر وسائل جديدة لتعزيز التعاون بين مختلف التخصصات وتجاوز 
نموذج العام الواحد؛ وتوسعة الروابط البحثية مع المؤسسات غير الأكادمية وتضمين جمهور 
جديد على نطاق أوسع )2008 .(Sword‏ وتخضع هذه الفرص للدراسة على نطاق واسع 
من خلال المجال الناشئ للإنسانيات الرقميةء والذي يجمع العلا سونا من جميع العلوم 
الإنسانية كا مؤرخينء واللغويينء والفنانين ال مبدعين: وعلماء الأدب والإعلام... إلخ مع Alas‏ 
امكتبات. وعلماء الحاسسء والسانات: وال معلومات. 
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وبشكل 4324s‏ فإن العلوم الإنسانية الرقميه تتشكل من dalea‏ وتحليل البيانات 
التي تكونت في الأصل بشكل رقميء ورقمنة وأرشفة المشروعات التي تسعى إلى تحويل 
النصوص وال مواد التناظرية إلى صيغ رقمية بحيث مكن تنظيمها والبحث فيها وإخضاعها 
لأشكال أساسية من التحليلات AII‏ والموجهة. والشاملة. مثل العروض المرثية ا موجزة 
للمحتوى أو الروابط بين المستندات» والناس أو الأماكن )2009 (Schnapp and Presner‏ 
ونتيجة لذلكء فلقد ادعى المؤيدون أن المجال قد تطور لكي يوفر أدوات أكثر تطورا 
معالجة. وبحث» وربطء ومشاركة. وتحليل البيانات التي تسعى إلى إتمام ودعم طرق 
العلوم الإنسانية الحالية وتسهيل الأشكال التقليدية من التفسير وبناء النظريةء وذلك بدلا 
من استبدال الطرق التقليدية أو تقديم منهج وضعي أو تجريبي لعلماء العلوم الإنسانية 
(Berry 2011; Manovich 2011)‏ 

إن ما توفره العلوم 45L 5I‏ الرقمية هو وسيلة لمعالجة ومشاركة البيانات» 55 63b‏ 
التحليل التقليدي» وتعزيز البحوث عبر مدى وحجم أكبر بكثير من المصادرء وتوفير الوقت 
والجهد. وبدلا من التركيز على حفنة من روايات العصر الفيكتوري أو صور من أوائل القرن 
العشرين أو اثنين من فناني عصر النهضة وأعمالهم: يصبح من الممكن البحث والربط عبر 
عدد كبير للغاية من الأعمال ذات الصلةء وبدلا من التركيز على حفنة من ال مواقع الشبكية 
أو غرف الدردشة أو الصور أو الفيديوهات أو الصحف الإلكترونيةء يصبح من ال ممكن دراسة 
الآلاف من مثل هذه الوسائط. ومن ثم فلقد ادعى )2011( Manovich‏ أن: "الدراسة 
اللعززة بالحاسب للجموعات انات ثقافية هائلة bale‏ ما تكشف أنماطا جديدة للبنانات 
التي لا يمكن حتى من خلال القراءة المتأنية لأفضل دليل أن تكشفها". وبالطبع» O‏ جيشا 
من slale‏ العلوم الإنسانية لن يكون قادرا بشكل حريص على القراءة ا متأنية لمجموعات 
بيانات هائلة في المقام الأول. وادعى )2005( Moretti‏ أن العلوم الإنسانية الرقمية ستطبق 
الصرامة المنهجية على التخصصات التي كانت في السابق غير نظاميه وعشوائية في تركيزها 
ومنهجها المتبع. وادعى أن الأدبيات ذات الصلة بالأعداد. والأشكالء والوسائط ال مرئية من 
ا لمحتمل أن توفر رؤى جديدة وتضفي رونقا جديدا على المجالات AS il‏ 
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وف الوقت «I5‏ وكما أن هناك Ló‏ هناك أيضا مجموعة من التحديات. فبالنسبة 
للمعارضين: فإن استخدام طرق العلوم الإنسانية الرقمية الجديدة سوف تعزز ما أطلق 
عليه )2005( Moretti‏ مصطلح "القراءة عن بعد" حيث ممكن لأجهزة الحاسب أن تعمل 
مثل الات القراءة )2010 (Ramsay‏ فمثل هذا النهج يتعارض مع الممارسة الراسخة منذ 
أمد بعيد والمتعلقة بتوفر قراءة متأنية للمصدر. وقد ادعى )20 :2010( Culler‏ على 
سبيل المثال بأن: "ما يتعارض مع القراءة المتأنية ليس القراءة عن بُعد ولكن شيئا ما Jia‏ 
القراءة غير المتقنة أو القراءة العرضية". واستمر قائلا بأن القراءة المتأنية تتضمن الاهتمام 
بكيفية إنتاج أو نقل المعنىء وبنوع الإستراتيجيات والأساليب الأدبية والبلاغية المستخدمة 
من أجل تحقيق ما يمكن للقارئ أن يأخذ به على أنه المؤثر على العمل أو الفقرة (ص 
22( وهذا شيء لا يممكن للقراءة عن بعد أن تقوم به» فقلق Culler‏ ناتج عن أن العلوم 
الإنسانية الرقمية لا تسهل أو تعزز "القراءة عن بعد" فحسب» بل lil‏ تجعل "من الممكن 
إجراء البحوث الأدبية بدون القراءة على الإطلاق: مثل إيجاد كافة الحالات التي وردت فيها 
كلمتي "يتسول" و"متسول"' في روايات كتبها اثنان من المؤلفين ثم كتابة النتائج" (ص 24). 

وعلى نحو «oL às‏ ذكرت )164 :2009( Trumpener‏ بآن: "النموذج المقاد إحصائنا 
لتاريخ الأدب... يبدو أنه يتطلب يدا مجهولة غير مرئية. وعلاوة على «AUS‏ فإنه يحدد 
الأماط ولكنه يتجنب تحديد السببية»ء والتي لا مكن تحديدها من خلال تتبع محفوظات 
الناشرين» وقراءة مسودات ال مخطوطات الفردية في مكتبات الكتب النادرة ومحاولة 49« 
من كتاب لكتاب» من قام بتحديد عنوان كل رواية: المؤلفء الناشرء أو وكيل الدعاية" (ص 
24 وبالنسبهة لهاء فإن مثل هذا البحث يتضمن حركة حقيقيه وليس استخدام مجموعة 
من الخوارزميات. كما أكدت أن تحليل آلاف النصوص يعني "أن أى نص معين سوف يصبح 
غير ذي صلة من الناحية الإحصائية" (ص 164). واستمرت قائلة " أي محاولة لرؤية الصورة 
بالكامل تحتاج إلى دعم من قبل ال معرفة الواسعة وفهم تأريخي فطن LAS‏ عمل الأساليب 
وامؤسسات الأدبية والأدوات التفسيرية القاطعة. وف معرض تقديرها للجزافية ". اختتمت 
كلامها (ص (VY - ١7١‏ قائلة al‏ من eal"‏ أن معظمنا تخلى عن الاستمرار في البقاء في 
المكتبة... فاليأس من عدم توافر المعرفة الشاملة يجب ألا يدفعنا إلى التفكير المتطرف 
المعاكس بأنه يجب علينا أن نبدأ في معالجة الأدبيات بكميات هائلة لي نحرز أي تقدم". 
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وبال مثل: فبالنسبة ل )2012( Marche‏ فإن الآثار الثقافية مثل الأدبيات لا مكن معاملتها 
كونها مجرد بيانات. فالجزئية الأدبية المكتوبة لا مكن أن تكون ببساطة مجرد ترتيب 
للحروف والكلمات» بل هي مقترنة بالسياق وتنقل المعنى ولها سمات تفوق الوصف. 
فالخوارزميات ضعيفة للغاية فيما يتعلق بالتقاط وفك تشفر ال معنى أو السياقء وكما 
ادعی glè Marche‏ الخوازميات تعامل جميع WINS‏ كما لو كانت هي نفسها. واستمر 
قائلا: "إن التحليل الخوارزمي للروايات والمقالات في الجرائد يكون بالضرورة ضمن حدود 
الاختزالية. إن عملية تحويل الأدب إلى بيانات تزيل التفوق ذاته. وهي تزيل التذوق وتزيل 
جميع الدقة من النقدء وتزيل التاريخ المرتبط بإطلاق هذا العملء فرواية "إلى المنارة" ما 
هي إلى رواية أخرى من ضمن ركام الروايات". 

وعلاوة على ذلك» فبالنسبة للآخرينء فبدلا من العمل على المضادر الأصليةء فإن العلوم 
الإنسانية الرقمية تتعامل مع الأشياء الرقميةء التى تنقل ذفعة واحدة وتختلف من الناحية 
الكيفية عن أصولها (بمعنى أنها وصف للوصف) وذلك من شأنه أن يؤثر بشكل حتمي على 
فسا 

وبالنسبة للكثيرينء فإن العلوم الإنسانية الرقميةء في هذه الحالة»ء تعزز التحليلات 
السطحية الضعيفة بدلا من الزؤى العميقة ال متخلخلة؛ ولذاء يتم نقدها على اختزاليتها 
المفرطة وعدم إتقان أساليبهاء وتضحيتها بالتعقيد: والتدقيق: والسياق» والعمق: ونقدها 
للأماط الوصفية: والآلية» وا مدرجة: وال متسعة. والانطباع ob‏ التفسير Y‏ يتطلب معرفة 
سياقية عميقة. ومن 92 فلقد ادعى )2013( Jenkins‏ أن: "قيمة الفنون وجودة ال مسرحية 
أو الرسم لا يمكن قياسها على الإطلاق. فأنت بمقدورك وضع جميع أنواع البيانات ف آلة: 
التواريخ» والألوان» والصورء وإيصالات شباك SIAII‏ ولكن لا يمكن لأي منهم أن يفسر ما 
هو العمل الفنى» وما الذي يعنيه. وما السبب في قوته: فالإجابة عن هذه الأسئلة تتطلب 
إنسانا وليس آلة. وف حين أنني متأكد أن البيانات الكبيرة مفيدة, إلا أنها لا تنطبق على 
جميع مجالات الحياة البشريةء فهى لن تحسن الظروف البشرية. فالحب» والثقافةء والفنء 
والسياسة أمور ضرورية في حياتنا ولكن البيانات الكبيرة تخبرنا القليل عن هذه الأمور. 
وباختصارء لا تصدق جميع الدعايات عن البيانات» فهي ليست الإجابة عن الأسئلة الكبيرة". 
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وعلاوة على ذلك» فإن التمويل المحدود المخصص للعلوم الإنسانية تتم إعادة تركيزه 
على مشروعات العلوم الإنسانية الرقمية وذلك على حساب الدراسات الأكثر تقليدية مما 
يحرم بعض تخصصات العلم من التمويل. وتسري تأثيرات عمليات إعادة توزيع التمويل 
Lj]‏ داخل العلوم الإنسانية الرقمية ذاتها. e uo‏ غالبا ما يتم توجيه التمويل تجاه بناء 
البنى التحتية للبيانات وإنشاء أدوات جديدة, وذلك بدلا من تمويل مشروعات تستفيد من 
المجموعات الرقمية من أجل الإجابة على الأسئلة الأكثر جوهرية. والنتيجة توجيه التمويل 
تجاه هندسة اللرمجيات. وتطوير أدوات تحليلية. ومعدات» ومخترات» ومشروعات الموارد 
الأخرى: وذلك بدلا من تمويل العلوم الإنسانية بذاتها. 

ويمكن أن تنطبق ذات أنواع ال مناقشات هذه فيما يتعلق بالعلوم الاجتماعية الحاسوبية. 
فعلى سبيل JEI‏ في مناقشة gles‏ بتأليف التصوير في ويكيبيدياء ادعت فيرناندا فيجاس 
(Frenanda B. Viegas)‏ والتي تعمل في مختبر الاتصالات المرئية في (IBM)‏ أن التخطط 
ا مرئي للبيانات يمكن أن "يستاعد الباحثين على تحديد الأسئلة التى رما مكن استكشافها 
من dao bl‏ الا کن يمل (3a Us «JEU.‏ کر دجوت ال وما اق سرعة 
ارتداد النص؟ (مقتبس فى 11 :2010 .(Bollier‏ وعلى ex JI‏ من ذلك» تعد مثل هذه 
الأسئلة بسيطة نسبيا. ففي هذه الحالةء رما يكشف التخطيط dob‏ أن موضوعا ما تتم 
مناقشته بحماسة بالغة (alls‏ الذي يمكن أن dew‏ محرري ويكبيديا يتدخلون في عملية 
تحرير مدخلات البيانات» ولكن التخطيط ا مرئي يفعل القليل للإجابة على الأسئلة الأكثر 
فعا وتقنويقا $9 Jis là.‏ أسباب وطبيعة النزاعات والقصص البديلة التي يتم إنتاجها. 
ولا تتم دراسة أي منها بشكل أمثل من خلال الإحصائيات. deg‏ نحو alis‏ فإن خريطة 
لغة التغريدات في مدينة ما رما تكشف أنماط التركيز الجغراق لجماعات عرقية متعددة, 
ولكن الأسئلة deal‏ هي من يشكل مثل هذه التركيزات» وما السبب في وجودهاء وما هى 
العمليات التي Cue dao]‏ في التشكيل والتكاثرء وما هي نتائجها الاجتماعية والاقتصادية. إن 
تحديد الأنماط iege‏ ؛ ولكن تفسير هذه الأنماط شيء مختلف Ll‏ حيث يتطلب نظرية 
اجتماعية ومعرفة سياقية عميقة. وق مثل هذه الحالات. فإن الخطر يكمن في أن Sgal‏ 
تمارس ببساطة بسبب توافر البيانات» مما يحد بشكل كبير من الأسئلة التي يمكن توجيهها 
وذلك لأن البيانات م يتم إنتاجها مع وجود مثل هذه الأستلة على البال )2013 .(Vis‏ وكما 
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ادعى )2013( :Gonzalez Bailom‏ "إن تخطيط التوزيع QA‏ للمشاعر الإيجابية» 9l‏ 
التكرار الذي يتم من خلاله ذكر بعض الكلمات في التواصل على الإنترنت لا يخبرنا الكثير عن 
توافق هذه الأنماط مع الديناميكيات الاجتماعية التي تشكلها وتخلقها... إن قياس الأشياء 
بسبب أنه ممكن قياسها فحسب» لا يجعلها مشوقة أو ذات صلة". 

às‏ حالات مثل خريطة التغريداتء فإن الأماط المكتشفة نادرا ما يتعين أن تكون نقطة 
النهاية وهو ما يبدو عليه الحال في بعض ال مشروعات )2013 2.2615 والأحرى أن تمثل 
الأماط المكتشفة نقطة Ls ilal‏ يتطلي بالتأكيد أشكالا أخرى من التحليلات Ue 5s‏ بعض 
مجموعات السانات الأخرى. 


وكما هو الحال مع الانتقادات الأولى للعلوم الاجتماعية الوضعية الكمية. فإن العلوم 
الاجتماعية الحاسوبية يزج بها في مهام من قبل ما بعد الوضعيين كونها ÀJI‏ ومفتتة 
ومحددة. وتقلص الأفزاد «ae gil!‏ والبنى الاجتماعنة المعقدة Sosia‏ الأبعاد: إلى مجرد 
نقاط بيانات Wyly)‏ متشور ف الصحافة). وغلاوةٌ على ذلك» فإن التحليل يفسد من 
قبل افتراضات الحتمية الاجتماعية كما أوضح )2012( Pentland‏ ذلك بالأمثلة قائلا: "إن 
نوعية الشخص الذي تكون عليه تتحدد بشكل كبير من قبل بيئتك الاجتماعية» ولذا ISI‏ 
كان بإمكاني رؤية بعض سلوكياتكء فيمكنني أن paz ul‏ الباقي» وذلك فحسب من خلال 
مقارنتك مع الأشخاص في جماعتك". وعلى النقيض من «S05‏ يدعى البعض أن ال مجتمعات 
البشرية معقدة للغايه وفوضوية وغير متوقعة لي يتم تحويلها إلى صيغ وقوانين» حيث 
توفر النماذج الكمية رؤى قليلة لتفسير الظواهر مثل الحروب» والإبادة الجماعية: والعنف 
الأسريء والعنصرية. وعلى الرغم من أن البيانات الكمية يمكنها أن توضح بعض هذه 
المجالات: فإنها توفر رؤى شاملة فحسس للأنظمة البشر db‏ الأخرى مثل الاقتصاد» وهى 
تفسر بشكل غير كاف دور السياسة: والأيدلوجياء والبنى الاجتماعية؛ والثقافه Harvey)‏ 
1972(. إن الناس لا يتصرفون بطرق منطقية ومحددة تسلف ولكن بدلا من ذلك فهم 
يعيشون حياة مليئة بالتناقضات» وا مفارقات. والحوادث غير المتوقعة. فالكيفية التي يتم 
من خلالها تنظيم وعمل ال مجتمعات تختلف عبر الزمان Oly‏ ولا يوجد شكل Jis‏ أو 
أفضل أو سمات عاطية. وف الواقع» يوجد تنوع مدهش ف الأفرادء والثقافات. وأساليب 
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الحياة على الكوكب. فتقليص Jis‏ هذا التعقيد إلى الموضوعات المجردة التي تشغل النماذج 
العاممية يؤدي إلى الكثير من العنف الرمزي فيما يتعلق بخلقنا للمعرفة. وعلاوة على ذلك 
فإن es Lil‏ الوضعية تتجاهل عن عمد اممجالات اميتافزيقيه La)‏ وراء الطبيعة) للحياة 
البشرية (المتعلقة با معانيء والمعتقدات. والخبرات) والأسئلة المعيارية (ا معضلات الأخلاقية 
وامعنوية بشأن كيف تكون الأشياء على النحو الذي يجب أن تكون عليه مقارنة بالوضع 
الحالي لهذه الأشياء) )2006 .(Kitchen‏ وبعبارة أخرىء فإن المناهج الوضعية تركز فقط 
على أنواع duse‏ من الأسئلة: والتي تسعى إلى الإجابة عنها بطريقة اختزالية تتجاهل على 
ما يبدو ما الذي يعنيه أن يكون المرء إنسانا وأن يعيش في مجتمعات وأماكن خصبة التنوع: 
وهذا لا يعني أن المناهج الكمية غير مفيدة بل هى مفيدة بشكل واضح للغايةء وخاصة 
فيما يتعلق بتفسير ونمذجة الأنظمة الآلية ولكن ينبغي فهم جوانب قصورها فيما يتعلق 
بفهم الحياة البشرية ودمجها مع المناهج الأخرى. 

ومن ثم فلقد ادعى Brooks (2013b)‏ أن تحليلات البيانات الضخمة تتصارع مع 
الطبيعة الاجتماعية كون الناس غير منطقيين ولا يتصرفون بشكل متوقع وكون الأنظمة 
البشرية معقدة بشكل غير معقول ولديها علاقات متناقضة ومتباينة. وهي تتصارع 
EUIS‏ مع السياق كون البيانات منفصلة بشكل كبير عن السياق «e zal‏ والاقتصادي» 
والسياسيء والتاريخي. وهي أيضًا تخلق أكواما هائلة من القش كونها تتكون من ارتباطات 
غير طبيعية هائلة للغاية مما يجعل من الصعوبة بمكان تحديد مكان الإبرة أو ما نبحث عنه 
وكونها تواجه مشاكل عند مجابهة المشاكل الكبيرة وخاصة المشاكل الاقتصادية والاجتماعية. 
وهي UIS‏ تفضل ال مستنسخ على الأصل كونها تحدد الاتجاهات ولكنها لا تحدد بالضرورة 
السمات اطهمة التي رها تتحول إلى اتجاه وكونها تحجب القيم وامصالح المتعلقة بمنتجي 
البيانات وهؤلاء الذي يحللون البيانات وأهدافهم. 

وهم يفعلون ذلك لأنه وكما قال )174 :1981( Peter Could‏ وهو مؤيد للمناهج 
الإحصائية في تحليل البيانات: "يبدو أن رموز لغاتنا الرياضية مقيدة ومحددة بشكل كبير. 
وفي الغالب هم يحدثون أضرارا ليس لأنهم يُقيدوننا فحسب. ولكنهم في الواقع يمحون من 
الوجود ما يمكن أن يكون مستحقا لانتباهنا واهتمامنا. وإذا ما تصورناء liag‏ ما نفعله في 
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الغالب» الطبيعة متعددة الأبعاد التي تصف تعقيد حياتنا المعاصرة... والفراغات الناتجة 
بواسطة الفلتر الخطي (Strainer Called)‏ المسمى تحليل العامل (Factor Analysis)‏ 
فرمما نقوم بسحق امعلومات خارج الوجود وذلك تحت مسمىٍ التبسيط. إنني لست 
متأكدا تماما من السبب els‏ فعل ذلكء عدا أن لدي شعورا مؤكدا تقريبا ob‏ توافر أجهزة 
حاسوب كبيرة وسريعة. وكذلك البرامج الجاهزة له يد في ذلك . 


وبالنسبة ل «Gould‏ فإن فهم السلوك البشري وا مجتمعات البشرية لا يمكن ولا يجب 
تحويله إلى تحليلات متكررة ومنهجية وآلية: ولقد دعا إلى التفكير المستدام بشأن أنواع 
الأساليب التي يتعين استخدامها مع أي نوع من البيانات» وتحت أي ظروف» وذلك من 
أجل الإجابة عن بعض الأسئلة ا لمحددة, بدلا من تشغيل البيانات من خلال guas‏ نقانق 
إحصان (Sls‏ ينتج logod‏ منخفضة الجودة من الألف إلى اليظاء بدلا من تقطيع اللحوم 
اطنتقاة. 

وفيما يتجاوز الأملوبٍ المنهجي وال معرفيء فإن جزءاً من القضية هو أنه يبدو أن بعض 
تحليلات البيانات الكبيرة تحدث دون وجود أي أسئلة على البالء أو أن يكون التركيز 
sida‏ هن قزل الظريق oe‏ أو ST sl od dicas de Nas abo JE A goo‏ 
تكون مجموعة البيانات مستخدمة من أجل البحث عن إجابات عن أسئلة م يتم تضميمها 
لكي يتم الإجابة عنها في المقام الأول. وفيما يتعلق بالآخيرء م يتم إنتاج بيانات تويتر ذات 
IU‏ المحدة:حغرافا من أجل تقديم إجابات تتعلق بالتركيز الجغرافي لمجموعات اللغة في 
مدينة ما والعمليات التي تقود مثل هذا الارتباط SI‏ المكاني. فنحن يجب علينا ألا نشعر 
بالدهشة رها في حالة ما إذا كانت النتيجة لقطات سطحية فحسب» حتى وإن كانت لقطة 
رائعةء بدلا من ذلك OB‏ ما يجب أن يدهشنا هو الرؤى المتعمقة والمتغلغلة في جغرافيات 
الجنس» واللغةء والتكتلات» والانعزال في أماكن معينةء ولهذه الأسباب. ستظل دراسات 
البيانات الصغيرة مفيدة. 

وق معرض الدفاع عن eas al ell‏ من قبل العلوم الإنسانية cda JI‏ ادعى 
Manovich (2011)‏ أن الهدف ليس استتبدال الخراء البشريين بأجهزة الحاسبء ولكن 
الهدف هو استخدام التحليلات من أجل استكشاف مجموعات البيانات الهائلة مثل بلايين 
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التغريدات» 9l‏ ملايين الفيديوهات على موقع يوتيوب» 9l‏ عشرات الالاف من الروايات ومن 
ثم اختيار أهداف duszo i LÀ‏ من أجل التحليل !$924 المحكم. وبعبارة أخرىء قان 

منهج العلوم الإنسانية الرقمية يفتح أمامنا إمكانية إجراء الدراسات السطحية على نطاق 
واسع عبر الأشخاص بدلا من الدراسات المتعمقة التي تركز على أعداد قليلة من الأفراد 
.(Manovixh 2011)‏ وبا مثلء: يدعي البعض أن هذ المنهج يوفر العمل الدؤوب للتعمق 
في GN‏ صفحات الأخبار ومشاهدة مئات الساعات من البرمجة. لكي "يتمكن الباحثين 
من تركيز طاقاتهم بشكل فعلى على التفسير" )2012 Jig (Harris‏ اقترح Flaounas et‏ 
(al. (2013: 111‏ أن: " أتمتة الكثير من eal‏ في تحليل المحتوى الإخباري لن يحل محل 
الحكم البشري المطلوب من أجل أشكال التحليل النوعية والدقيقةء ولكنه سوف يسمح 
للباحثين بتركيز اهتمامهم على مدى أبعد بكثير من أحجام عينة الأشكال التقليدية من 
تحليل المحتوق: وبدلا من قضاء الكثير من العمل الثمين على مرحلة ترميز البيانات الخام» 
مكن للمحليين التركيز على تصميم التجارب والمقارنات من أجل اختبار فرضياتهم» olo‏ 
يتركوا لأجهزة الحاسب dago‏ اكتشاف جميع المقالات في موضوع «sa‏ وقياس العديد من 
سمات ال محتوى مثل قابليتهم (eel AU‏ واستخدام أشكال معينة من اللغة والمصادرء إلخ. 
مجرد عدد قليل من المهام التي يمكن أتمتتها في الوقت الراهن". 

وبا لمثلء فلقد ادعى )2012( Selisker‏ أن العلوم الإنسانية الرقمية لا تتسعى إلى "أن 
تستبدل الأدب برموز الحاسب» أو أن تقايض التعقيد الأدبي بصيغ لا هدف لها. ودلا من 
US‏ فإن هذه المشروعات تفكر فحسب بطرق إبداعية عن المشاكل التاريخية iu‏ التى لا 
مكن التعامل معها بسهولة بدون الحواسيب". وبالنسبة ل )2010 ;2003( Ramsay‏ مكن 
أن تساعد الحوسبة في عملية التفسيرء ولقد ادعى أن القراءة المتأنية تتضمن ممارسات اختيار 
وعزل وملاحظة الأماط «oos à‏ وان ) الترميز ذو كفاءة عالية في مثل هذه الممارسات» 
وعلاوة على ذلك فإن الترميز يقوم بالأمر نفسه بطرق أكثر موضوعية واتساقا من النظرة 
الذاتية «els‏ وبدلا من استبدال التعرف على المعنى» duals‏ له فإن توظيف الخوارزميات 
dyus‏ هذه العملية. 
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إن دفاع العلوم الاجتماعية الحاسوبية أمر مختلف تماما في الغالب» ففي حين أن جميع 
العلوم الإنسانية الرقمية تقر بقيمة القراءة المتأنية» وتؤكد أن القراءة عن بعد تكملها 
من خلال توفير التعمق والسياقية. فإن الأساليب الموضوعية للعلوم الاجتماعية تتعارض 
مع المناهج بعد الوضعيه. إن الفرق بين العلوم الاجتماعية الحاسوبية والعلوم الإنسانية 
الرقمية بهذا الصدد يرجع إلى أن الإحصائيات المستخدمة ف العلوم الإنسانية الرقمية 
وصفية بشكل كر تحدد الأنماط وتصوغهم كأعداد وصور وخرائط. وعلى النقيض من 
ذلك» فإن العلوم الاجتماعية الحاسوبية تستخدم ال منهج العلمى حيث LS‏ الإحصائيات 
الوصفية بالإحصائيات الاستدلاليه التي تسعى إلى تحديد السببية. وبعبارة اخرىء فإنها 
تحصل على الدعم من قبل ال معرفة حيث يكون الهدف هو تقديم نماذج إحصائية متطورة 
تفسر وتحاي Loss‏ بالحياة البشرية. ومن الصعوبة بمكان التوفيق بين هذا وبين مناهج 
ما بعد الوضعية: فالدفاع في هذه الحالة يرتكز على فائدة وقيمة الطريقة والمناهج» وليس 
على توفير تحليل تكميلي لمجموعة من البيانات أكثر Joa‏ 

وهناك بدائل لمثل هذا الموقف. مثل البديل الذي تم تبنيه في نظم المعلومات الجغرافية 
(GIS)‏ والإحصائيات الجذرية (Radical Statistics)‏ وهؤلاء الذين يستخدمون مناهج 
ذات طرق مختلطة. وهذا يتضمن إما توظيف النماذج والإحصائيات الاستدلالية شريطة 
أن يكون هنالك إدراك طمواطن الضعف فيهماء csl‏ كما يحدث على نحو شائع: استخدام 
الإحصائنات الوصفية التق تدعقها دراسات OBI‏ الضغيرة. das‏ يتم'استخداة كل من 
البيانات الكبيرة والبيانات الصغيرة من أجل توفير رؤى مختلفة ولكن تكميلية. وبغض 
النظر عن مثل هذه التكميلية»ء فإن الكثير من علماء ما بعد الوضعية سوف يستمرون في 
مقاومة البيانات الكبيرة والمناهج الإحصائية بأشكالها المتعددة: وبلا شك فإن المجادلات 
سوف تتسارع وتيرتها قي المستقبل ال منظور. 
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إعادة صياغة بحوث العلوم» والعلوم الاجتماعية: والعلوم الإنسانية 


الخاتمة: 

هناك شكوك قليلة بأن ثورة البيانات أتاحت احتمالية إعادة التشكيل المعرف للعلوم 
والعلوم الاجتماعية والإنسانية» وأن مثل إعادة التشكيل هذه تحدث بالفعل بشكل فعال 
ونشط. فالبيانات الكبيرة وتوسع البيانات الصغيرة من خلال البنى التحتية للبيانات يساعدان 
على تنفيذ galia‏ جديدة تجاه إنتاج وتحليل البيانات» مما يجعل من الممكن توجيه الأسئلة 
والإجابة عنها بطرق جديدة. وقد شجع هذا البعض على الادعاء بشكل جريء Ob‏ ثورة 
البيانات هي ابتكار تدميري يعلن عن نقلة نوعية في كيفية إجراء البحوث. وهذه بالقطع 
هى الحالة حيث إن التحول من صحاري البيانات إلى طوفان البيانات وتحليلات البيانات 
الجديدة سيغير الممارسات البحثية. وعلى الرغم من ذلكء يتعين أخذ الحيطة عند القيام 
بتأكيدات تتعلق بإعادة تشكيل البحث وبأفضل طريق مكن اتباعه في إعادة التشكيل oja‏ 

إن العلم يعامل بشكل سين من قبل الادعاءات القائلة ob‏ ثورة البيانات تعني "أن 
البيانات يمكنها أن تتحدث عن نفسه" أو أنه يممكنها بدون أي مشاكل استخدام أساليب 
مثل تجريف البيانات حيث يسبق الارتباط السببية» (انظر الفصل التاسع). وتعد المناهج 
التي يتم تطويرها داخل العلوم المقادة بالبيانات والتى تمزج بين «JV‏ والاستنتاج 
والاستقراء أكثر إنتاجية بكثير. حيث تتم إعادة تشكيل الطريقة العلميةء وذلك بدلا من 
تدميرهاء إن الأسس الفلسفية للعلم المقاد بالبيانات: على الرغم من ذلكء لا تزال في أطوارها 
التمهيدية وهناك حاجة للتفكير المستفيض في معتقداتها ال معرفية ومبادتها ومنهجيتها. 

أما ا موقف فيما يتعلق بالعلوم الاجتماعية والعلوم الإنسانية فهو أكثر تعقيدا بشكل ما 
وذلك إذا وضعنا في الاعتبار تنوع الأسس الفلسفية لهذه العلوم حيث إنه من غير ال محتمل 
أن تقود ثورة البيانات إلى تأسيس نموذج جديد. وبدلا من ذلك فإن البنى التحتية للبيانات 
وثورة البيانات سوف يعززان مجموعة البيانات المتوافرة للتحليل ويمكنان مناهج وأساليب 
جديدة: ولكنها لن تحل محل دراسات البيانات الصغيرة. وفيما يتعلق بالعلوم» هناك 
حاجة لتفكير نقدي أوسع ف الآثار المعرفية لثورة البيانات على العلوم الاجتماعية والعلوم 
الإنسانيةء وهذه المهمة بدأ بالكاد التعامل معها وذلك على الرغم من سرعة التغيير الحاصل 
في مشهد البيانات. 
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الفصل التاسع 
القضايا الفنية والتنظيمية 


(Technical and Organizational Issues) 


كما ناقشنا في الفضلين السابقينء توفر البنى التحتية للبيانات ومبادرات البيانات 
المفتوحة وإنتاج البيانات الكبيرة فرصا جديدة لقياس وفهم العالم. وهي أيضًا تثير Llas‏ 
فنية وتنظيمية» وتطرح أسئلة معيارية وأخلاقية. وفي هذا الفصلء سيتم التركيز على الأمر 
الأولء ما يعني التركيز على بعض القضايا Jia‏ مجال مجموعات البيانات» والوصول إلى 
السيانات» وجودة السانات» وتكامل السباناتء والتبادلية (القابلية (JLU‏ وتطبيق التحليلات 
والمغالظ coL‏ البيئيةء والمهارات والقدرات والإمكانات التنظمية. فبعض هذه القضايا مكن 
التعامل معها من خلال الحلول الإدارية والفنية» في حين أن البعض الآخر من هذه القضايا 
تمثل مشاكل عسيرة الحل ومن الصعب التعامل معها. وعلى الرغم من ذلكء فإذا كانت 
القضايا المتعلقة بجودة البيانات وال مغالطات dadl‏ لا مكن التعامل معها بشكل كافء 
ففي هذه الحالة لا يهم ماهية النظريات المعرفية التي يتم تطبيقهاء (انظر الفصل الثامن)» 
GY‏ التحليلات والتفسيرات ستكون محل ارتياب. وعلاوة على ذلك. فإذا كان الوصول إلى 
البيانات مقيدا بشكل كبيرء أو إذا كانت الحكومات والشركات والمجتمع all‏ يفتقرون 
المهارات الكافية لإدراك المغزى من هذه البيانات» ففي هذه الحالة ستكون قيمة ومنافع 
البيانات المفتوحة والكبيرة المتدرجة مقيدة بشكل كبير للغاية. ونتيجة لذلك» فإن القضايا 
التي تمت مناقشتها في هذا الفصل لا مكن تجاهلها أو إبعادها بسهولةء ومن ثم فهي 
تتطلب الاهتمام البالغ. وفي الفصل التاليء سيتحول التركيز إلى قضايا سياسية واجتماعية 
أعم وأشمل والتي تتعلق بإنشاء ومشاركة وتحليل واستخدام البيانات مع الوضع في الاعتبار 
الأبعاد الأخلاقية: والقانونية: والأمنية لثورة السانات. 
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الصحاري والفيضانات :(Deserts and Deluges)‏ 
في كافة النقاشات الدائرة olis‏ 8555 البيانات يكون ف الغالب من الصعب تحديد مصدر 
مجموعة مناسبة من البيانات فيما يتعلق بالكثير من الظواهرء وبخاصة تلك البيانات التى 
تغطي فترات زمنية طويلة ومتأصلة مكانيا. وبشكل جزئ» فإن هذه تعد قضية من قضايا 
التغطية من ناحية» ومن قضايا الوصول من ناحية 45,21 فمن جانب التغطيةء فإن جميع 
مصادر البيانات محددة من ناحية العينةء وا مدى الجغرافيء «3391s‏ ومتغيرات الصفات 
(الحقول) والمؤشرات. وف الواقع» فإن العام معقد بشكل كبير لغاية أنه يستحيل التقاط 

نطاق كامل وكافة فروقاته الدقيقة. وتناقضاته» وتبايناته. 

إن البيانات التى يتم جمعها من خلال دراسات البيانات الصغيرة تعد عينات بشكل 
صريح «IU‏ وهي تجمع بشكل غير مستمرء وهي ذات رقم محدد من المتغيرات وذلك 
بالنظر إلى تركيزها المحكم والتكلفة المرتبطة بالجمع والتحليل» فمعظم هذه الدراسات 
تمثل دراسات sl‏ تجارب منفصلة تركز على قضايا وحالات uza‏ ممجموعة» مؤسسة. أنواع: 
أماكن» تقنيات... إلخ» وهي تفتقر إلى المكون الطولي حيث إنها لا تغطي فترات زمنية 
متعددة وطويلة. فالدراسات التي تقوم بدراسة التغييرات بمرور الوقت عادة ما يتم 
تكرارها على فترات محددة. وف هذه الحالة: فإن فهمنا لظاهرة معينة عادة ما يعتمد 
على مجموعه مقيدة من البيانات» وحتى عندما يتم تجميع وترقيه مجموعات البيانات 
داخل البنى التحتية للبيانات» فإن التغطية تكون جزئية وانتقائية. فعلى سبيل JALI‏ فإن 
مجموعات بيانات الإدارة العامة الأيرلندية ذات تغطية محدودة وهي مملوءة بالفجوات 
والسكنات عن قطاعات duszo‏ مثل قطاعات الإاسكان والنقلء وغالا ما يتم الاحتفاظ بها 
داخل المؤسسات )2007 (Kichin et al.‏ 

وعلى نحو مشابه» فإن البيانات الكبيرة رها تميل إلى أن تكون بيانات شاملة» ولكن وكما 
هو الحال مع مجموعات البيانات الأخرىء» فإن كلتيهما تكون تمثيلا dusg‏ وهی تحل» 
بشكل 52 فحسب» قضية صحراء البيانات التي يقصد بها أن تكون البيانات موزعة على 
مجاميع بيانات متفرقة يصعب استقاء البيانات منها أو إضافة بيانات اليها. وكما لاحظنا 3 
الفصل الثاني فإن البيانات التي يتم التقاطها تتشكل من قبل التقنية المستخدمة: والسياق 
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القضايا الفنية والتنظيمية 


الذي تم فيه إنشاء هذه البيانات» وتوصيف البيانات الذي تم توظيفه. فالبيانات المنشئة 
تمثل عادة ما يمكن التقاطه إلى حد ما بطريقة مباشرة. وهي تكون في غالب الأحيان منتجا 
فرعيا للنظام» ويكون مجالها الفوري مقيدا من قبل النطاق كسلاسل الأسواق المركزية 
وشبكات «Dl s al‏ ومواقع التواصل الاجتماعي. وفيما يتعلق بالعلوم: فإن البيانات 
الكبيرة يتم إنشاؤها حاليا U‏ يتعلق بمجموعة منتقاة من ا موضوعات hid‏ وهي بعيدة 
كل البعد عن أن يتم إنتاجها عبر جميع النطاقات والبؤر العلمية. وعلاوة على US‏ فإن 
القرار فيما يتعلق بإنشاء البيانات الكبيرة لم يتشكل caso‏ ولكنه يتطور ويتركز من أجل توفير 
مجموعة من الرؤى. بحيث تشكل كل واحدة منها Law‏ من العناصر التي يتم التقاطها 
كالاتساع» والعمقء والتفاصيل... إلخ. وحتى عندما يتم دمج بيانات كبيرة مع مجموعات 
البيانات I‏ 55-2« فإن مجالهم يكون la aso‏ كل البعد عن كونه مجالا عالميا. ولذاء فإن 
البيانات الكبيرة» في هذة الحالةء لا تعالج مسألة صحاري البيانات وذلك فيما يتعلق بالكثير 
من مجالات الدراسة. 

وف الوؤقت:نفسه. وف خان أن «joue‏ البيانات فازال تواجدها مستمزراء.فإن البنى 
التحتية BU‏ والسانات الكبيرة أنشاًا طوفانا من البيانات في بعض المجالات. وكما لاحظنا 
في الفصل al JI‏ كان هناك Sada: M‏ في حجم وسرعة إنتاج البيانات والتي تم تحديدها 

من Jel‏ أن تنمو بسرعة dle‏ وذلك مع إنشاء وبدء المصادر الجديدةء وتعقد مجموعات 
البيانات التي تم إنتاخها:"وانلقدزة على ربط السانات OUS (yag ax paso‏ :هذ الطوفان 
أن يفرض عددا من التحديات فيما يتعلق باطناولهء وا معالجه» ulilo‏ والتصنيف» والفهم 
| هذه السانات )2011 (Gantz and Reinsel‏ وبدلا من مجموعات السيانات الصغيرة 
وغير المستمرة: يحاول ال محللون الاستفادة من الكميات الهائلة من البيانات التي يتم تدفقها 
من أنبوب سميك. فمعظم هذه البيانات أصبحت بيانات عابرة وتم فقدهاء وم يتم أبدا 
تحليلها أو الاستفادة منها. وبعض هذه البيانات قد تم تخزينها في مستودعات البيانات 
التى تمثل إلى حد كبير مكبات غير مراقبة للنفايات )2013 (Asay‏ وهناك يتم الإبقاء عليها 
حتى gb‏ أوقات مكن لهذه البيانات أن تقدم فيها معلومات مفيدة. ونتيجة لذلكء وبينما 
تزداد نسبة البيانات بشكل تصاعديء فإن نسبة البيانات التي يتم معالجتها وتحليلها تقل 
بشكل .(Zikopoulos et al 2012) S‏ وقد أشار )2012( Wu‏ إلى أنه في الوقت التى 
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تزداد فيه البيانات» يتم الحصول على معلومات أقل كنسبة من هذه البيانات. وبعبارة 
oloy «6,21‏ ضوضاء البيانات بشكل كبير للغاية ولكن إشارات المعلومات تنمو بشكل أقل 
بكثيرء وعلاوة على ذلك. يصبح يصبح الأمر أكثر صعوبة J5sJ‏ هذه البيانات في خضم هذه الضواء 
(انظر 2012 re (Silver‏ بلا جدال وظيفة البيانات الكبيرة وعلم البيانات حيث لا 
يزالان في أطوارهما الأولية» ومع الاستغلال الكامل للأساليب الحديثة والتي بإمكانها مراقبة 
ومعالجة وتحليل كميات هائلة من البيانات بشكل GT‏ أو لحظي إلا أن هذا من المتعذر 
تحقيقه بشكل كبير. وحتى مع نضوج وتطور تحليلات البيانات الكبيرة, فإنه من المرجح أن 
تعاني من أجل تطوير طرق ومناهج يمكن من خلالها استخلاص التحليلات المفصلة وليست 
التحليلات السطحية؛ والتعامل مع أسئلة "SU"‏ وكذلك أسئلة "ماذا"؛ وتقديم إيضاحات 
وليس شروحات (انظر الفصل الثامن). وعلاوة على ذلك» يتعين تنويع هذه الطرق وذلك 
من أجل محاراة الأشكال الجديدة من البيانات التي يتم إنشاؤها من قبل المصادر ال مبتكرة. 
وحتى مع تحقيق «US‏ فإن مجاراة طوفان البيانات واستخلاص إشارات ذات مغزى من 
الضوضاء سيكون كفاحا EA‏ 


الوصول (Access)‏ : 
إن العائق الأساسي الآخر ald‏ الاستعانة مصادر مجموعات مناسبة للبيانات هو مدى 
قابلية الوصول إلى هذه المجموعات وقيود التراخيص التي تحدد معايير استخدام تلك 
Sle gazh‏ وبشكل واضح» وكما ناقشنا في الفصلين الثاني والثالث. فإن الوصول يعتبر 
قضية أساسية فيما يتعلق بالبحوث والبيانات الممولة من قبل المؤسسات العامة والتي 
تنشتها ona‏ العامهة. فمحفوظات السانات والبنى التحتىة SULLU‏ ومبادرات SEM,‏ 
المفتوحة Qus‏ وتهتم بشكل كبير بمشاركة وإنتاج السيانات المتاحة للتحليل. وكما أوضحت 
المناقشات في الفصول المشار إليها Ble‏ فعلى الرغم من حقيقة أن البيانات غير تنافسيةء 
وغبر قابلة للاستثناء أو الإقصاءء ولها تكلفة هامشية عند استنساخها )2010 (Floridi‏ إلا ol‏ 
اليانات مقيدة ة بشكل شائع وذلك عند توزيعها. وى بعض الأحيانء: فإن الوصول المقيد إلى 
ll des coL‏ مرغوبا فيه. وذلك إذا وضعنا ف اعتبارنا طبيعتها الحساسية والشخصية 
وكذلك البعد الأخلاقي المرتبط بنشر واستخدام هذه البيانات (انظر الفصل العاشر). às‏ 
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أحيان أخرىء يكون الوصول إلى البيانات مقيدا لأجل التأكد من أن هؤلاء الذين يحتفظون 
بهذه البيانات سيرفعون من قيمة هذه البيانات ويضيفون ميزات تنافسية لها أو يحققون 
أموالا من خلال البيع او الترخيص للوصول لهذه البيانات (انظر الفصل السابع). وف أحيان 
أخرىء ربما ترغب إحدى الهيئات في تقييد توزيع البيانات نتيجة أنها تخشى ما يمكن أن 
تكشفه هذه البيانات» والذي رها يكون له تداعيات سياسية أو اقتصادية» أو يكون مرد 
ذلك الخوف من كشف تدني جودة البيانات التي كانت محفوظة. 

s‏ حين أن هذه المعوقات بدأت تتلاشى ببطء فيما يتعلق بالبيانات الممولة والمستحدثة 
من قبل المؤسسات العامة ف الدول الدهقراطية الغربية: إلا أن مثل هذه التحركات تعد 
أكثر تقلبا مع تلك البيانات المستحدثة من قبل المؤسسات الخاصة. وف الواقع: فإن هذا 
الأمر يعد متتاقضا إلى حد ماء إذ إنه على الرغم من طوفان البيانات الكبيرة الناشئ. إلا 
أن daos)!‏ إلى مثل هذة:البيانات يظل مقيدا ومحدودا في الوقت Ug dll‏ بوجود 
عدد محدود للغاية من الكيانات الغارقة في مثل هذا الطوفان والتى يمكنها الوصول 
إليه )2011 (Crawford 2012, King‏ فالشركات من أمثال مشغاى الهواتف الخلوية. 
ومطوري التطبيقات» ومزودي وسائل التواصل الاجتماعيء وا مؤسسات AJU‏ وسلاسل 
التجزئة» وشركات المراقبة والشركات الأمنية: لا gi‏ على كواهلها أي التزامات لمشاركة 
البيانات التي يستحدثونها من خلال عملياتهم التشغيلية بحرية. وعادة ما يتم التفاوض 
للوصول إلى البيانات بشكل فردي وهذا يتضمن توقيع العديد من اتفاقيات حماية LSL‏ 
الفكرية واتفاقيات عدم الإفصاح» وكذلك الموافقة على الشروط والبنود التى تحدد كيف 
وف آي غرض سيتم استخدام أو Y‏ يتم استخدام مثل هذه البيانات. وحتى بعد كل dis‏ 
فمن المحتمل أن تمثل البيانات التي يتم توفيرها عينة محدودة: كما من الممكن أن تفتقر 
هذه البيانات إلى المعلومات السياقية مثل الكيفية التي تم تعيين هذه البيانات من خلالهاء 
أو تكون البيانات غير معالجة بشكل كبير أي لم يتم تنقيتها أو هيكلتهاء أو تكون مجمعةء 
أو مجردة من المتغيرات المفيدة: أو معالجة JS zo‏ أو بآخرء وذلك من شأنه أن A‏ 
أساليب تحليل هذه البيانات. وف بعض الحالات» يمكن أن يتم إتاحة كمية محدودة من 
البيانات LU‏ 34( والجمهور وذلك من خلال واجهات برمجة التطبيقات Application)‏ 
.(Programming Interfaces -APIs‏ فواجهات برمجة التطبيقات تتكون من مجموعة 
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من الأوامر التي يمكن استخدامها من أجل استعادة البيانات المخزنة في قواعد Olly‏ على 
خادم متاح الوصول aJl‏ للجمهور )2011 .(Manovich‏ فعلى سبيل «JUL‏ يسمح تويتر 
لعدد محدود من الشركات بالوصول إلى كافة ساناته المتدفقه عبر deiga‏ وذلك مقابل 
رسوم أو لأغراض تجارية. وهو يتمتع بالصلاحيات التي تسمح له بإملاء شروطه فيما 
يتعلق بالأغراض التي يمكن فيها استخدام مثل هذه البيانات. فالباحثون يتم تقسيمهم 
إلى قسمين: القسم الأول يمكنه الوصول إلى *٠١‏ من التغريدات العامةء والقسم الثاني لا 
مكنه الوصول إلا إلى >١‏ فحسب من التغريدات العامة أو يمكنهم الوصول إلى مجموعات 
فرعية مختلفة من المحتوى (الحسابات ال مدرجة ق القائمة (slal‏ وذلك مع استبعاد 
التغريدات الخاصة واطحمية في جميع الأحوال )2012 .(boyd and Crawford‏ وي 
حال المواقع الإلكترونية التى تحوي على سبيل المثال قوائم منتجات وتقييماتها Product)‏ 
(Listings and Reviews‏ وآدلة أعمال (Business Directories)‏ وكذلك في حال وسائل 
التواصل الاجتماعي والتي تتضمن الملفات الشخصية العامة (Public Profiles)‏ والتغذية 
(Feeds)‏ فإن بعض الشركات مثل (80legs) (www.80legs.com)‏ وشركة Mozenda))‏ 
((www.mozenda.com‏ توفر خدمات زاحف sl) aiJ‏ تصفح الشبكة dhlol‏ بطريقة 
منهجية وآليه ومنظمة) وتجريف الشبكة uel)‏ استخراج البيانات من مواقع الإنترانت عن 
طريق برامج مخصصة ) لحصد بيانات مفصلة من هذه المواقع أو للوصول لبيانات تغذية 

وما يقلق في هذا الأمر هو أن المعلومات التي يمكن أن توفرها البيانات الكبيرة المملوكة 
للشركات الخاصة والتي تم بيعها بشكل تجاري سوف تكون محصورة على قطاع الأعمال 
فحسب» أو رها يتم إتاحتها لمجموعة مميزة من الباحثين الأكاديميين الذين لا يمكن تكرار 
النتائج التي توصلوا إليها أو التحقق منها (2011 .(Lazer et al. 2009; King‏ ولا أحد 
من هذه المواقف يخده المصلحة العامة. ولكن إذا وضعنا ف اعتبارنا القيمة التجارية 
للبيانات محل المناقشة فإن زيادة الوصول إلى هذه البيانات لن يكون مهمة سهلة أبدا. 
فحقيقة أن البيانات الكبيرة الثرية من الناحيتين الاجتماعية والثقافية مملوكة للشركات 
الخاصة تشير إلى أنه في الوقت الحالى لن يكون من السهل ف الواقع إجراء بحوث العلوم 
الاجتماعية الحسابية والعلوم الإنسانية الرقمية )2011 LSS .(Manovich‏ ذكر كلا من 
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boyd and Crawford (2012: 673)‏ فإن " الكثير من الحماس الذي يحيط بالبيانات 
الكبيرة ينبع من الإدراك القائل بأن هذه البيانات توفر وصولا سهلا لكميات هائلة من 
البيانات. ولكن من يتمتع بمثل هذه القدرة للوصول إلى هذه البيانات؟ ولأي غرض يتم 
الوصول؟ وق ü‏ سياق يجرى هذا الأمر؟ وما معوقات الوصول؟" فهذه أسئلة تتطلب 
الكثير من التفكير مع اتخاذ إجراءات مناسبة. 


جودة وصحة وأصل السانات :(Data Quality, Veracity and Lineage)‏ 
$352 وصحة البيانات هما أمران مهمان للغاية كونهما يعززان المدى الذي يمكن أن 3 

فيه المرء بالنتائج المستخلصة من تحليل البيانات. وترتبط جودة البيانات بمدى تنظيمها 
أي خلوها من الأخطاء والفراغات» ونقائها أي خلوها من التحيزء وتماسكها معنى أن $923 
القلبل مت التناقضات. بينما يشير مصطلح صحة البيانات إلى موثوقية البيانات وإلى مدى 
تمثيلها للمعنى الذي : تشير اليه بدقة (إتقان) وأمانة (إخلاص). ولهذا فإن تأسيس $3939 
جودة وصحة البيانات يعتير شقا àv; à T‏ أصل السانات. فمُّلالة أصل البيانات همي: 


المعلومات التي تصف مصدر ال ملاحظات. والمنهجيات التي خضعت لها البيانات عند 
جمعها وتصنيفهاء والتعديلات» والتحولات» والتحليل: والاشتقاقات التي تعرضت لهاء وهي 
توفر أيضا الافتراضات وال معايير التي تم تطبيقها عند أي مرحلة من مراحل حركة هذه 
البيانات» وكذلك أي تحيزات... وتوفر سُلالة أصل البيانات مجموعة بيانات مع أصلها 
وتسمح للمستخدم أن يحدد مدى ملاءمه البيانات للاستخدام )2012 (Lauriault‏ 

وهي أيضا تصف بالتفصيل Lais‏ البيانات» ومن شأن الجودة والصحة Uig‏ الأصل 
الضعيفة للبيانات أن يقوضنّ درجة الثقة والمصداقية التي يمكن أن يضعها الشخص في 
مجموعة البيانات والتحليلات التي اعتمدت على هذه البيانات. 

ومن الناحية التقليدية» فإن الدراسات القائمة على بيانات نادرة والتي يكون حجم 
العينات فيها صغيرا ف الغالب» فإن جودة وصحة وأصل البيانات تكون على قدر كبير 
من الأهمية. فإذا كان الشخص سيعمل على استخلاص نتائج عن السكان بالكامل وذلك 
اعتمادا على عينة مثالية صغيرة: فإنه يتعين في هذه الحالة أن تكون العينة واضحة للغاية 


ثورة السانات السانات الكبيرة ة» والسانات «áo 92A!‏ والىنى daxil‏ للسانات» والنتائج ج المترتة عنها Y1!‏ 
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وخالية من العيوب بأكبر قدر ممكنء ويتعين أن تكون على درجة عالية من الدقة والصحة. 
وعلى e£ JI‏ من H US‏ عدد مجموعات البيانات يتم تشكيلها بشكل تام محدود للغايةء 
ويمكن استخدامها بدون أي شكل من أشكال تنظيف OLLI‏ بمعنى التحقق من الأخطاء 
وتصحيحهاء وإضافة البيانات المفقودةء ومعايرة وإعادة تهيئة البيانات حتى يكن ربطها 
مع بيانات أخرى أو لتكون هذه البيانات سهلة الاستجابة لمناهج تحليل معينة (انظر 
الفصل السادس). ولذاء فإنه يتم استهلاك الكثير من العمل خلال تصميم البحث من 
ال تقييد التحيزات المنهجية والتحيزات ال مرتبطة بتحديد العينات في يتم التأكد من أن 
البيانات دقيقة وذات مصداقية بقدر الإمكان قبل تحليل أو مشاركة هذه البيانات. وتعمل 
المحفوظات الأرشيفية والبنى التحتية بشكل نشط من أجل التأكد من أن تظل مثل هذه 
البيانات ذات مصداقية ودقيقة وصحيحة مرور الوقتء مع المحافظة على D‏ أصل 
البيانات من خلال الاستقرار المؤسسيء وعمليات إدارة البيانات وواصفات البيانات» وتمكين 
نقل البيانات عبر مختلف الصيغات والمنصات ما يحقق المؤامة بين الأجيال المختلفة من 
التقنيات )2012 .(Lauriault‏ وبدون Lo‏ هذا العملء فإن صحة الببانات المتضمنة داخل 
تلك البيانات سوف تتلاثى في القريب العاجل وذلك مع انعدام الثقة. 


وعلى النقيض من 5« ادعى البعض أن دراسات السانات الكبيرة ليست بحاجة إلى 
تطبيق معايير جودة وصحة البيانات ذاتهاء وذلك يرجع إلى أن الطبيعة الكلية .ملجموعات 
البيانات الكبيرة "25 الجميع" n-all)‏ ( تجعلها تتخلص من التحيزات المتعلقة بتحديد 
العينات» وتقوم بالتعويضء أكثر من المطلوب» عن أي أخطاء أو ثغرات أو تناقضات في 
LOL UI‏ أو أي ضعف في dmo‏ البيانات )2013 .(Mayer-Schonberger and Cukier‏ 
فالحجة التي استندت إليها وجهة النظر هذه أنه "مع 3929 عدد قليل من الأخطاء ال مرتبطة 
بتحديد العينةء يمكننا تقبل أخطاء أكبر مرتبطة بالقياس" (ص 13( "وهكننا التسامح مع 
عدم "I‏ (ص 16). إن الثمن LEL‏ ل "ن- الجميع" (n-all)‏ هو قبول الفوضى التى 
نشأت بشكل كبر من جراء صعوبة CAJAS‏ السانات ذات السرعة العالية وغير اللنظمة. 
وتقبل البيانات كونها "محتملة أكثر من كونها دقيقة" (ص 35). وعند النظر إلى الأمر 
Äi hI oap‏ ادعى )2013 (Mayer-Schonberger and Cukier‏ أنه " كلما كان هنالك 
سانات أكثرء كان ذلك أفضل" أو للتعبير عن هذا الأمر بشكل آخرء "إذا كان لديك بيانات 


yr‏ ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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كثرة دا قن ما do juo duc s‏ كاف تخد ندا à juo‏ فة )2011 s .(Helland‏ 
تم فقد ادعى )211 :2012( Franks‏ أن المطلوب هو 'بيانات نظيفة بدرجه 44385« وهي 
البيانات التي تمكن المحللين من "الحصول على النتائج التي مكنهم الوثوق بها". وبالطبع 
فإن هذا يفترض أن جميع استخدامات البيانات الكبيرة سوف تتسامح مع عدم الدقةء في 
حين أن الواقع يشير إلى أن الكثير من استخدامات البيانات الكبيرة تتطلب الدقة بشكل 
ous‏ أو على الأقل بيانات ذات معايير الأخطاء التي يمكن حسابها أي بيانات موثوقة. فعلى 
سبيل «JULI‏ فإن موقع خريطة الطريق ا مفتوح (OpenStreetMap)‏ يهدف إلى أن يكون 
في مستوى منتجات الخرائط الاحترافية من حيث التفصيل dlg‏ ويهدف كذلك إلى كسب 
AÈ‏ مستخدمىه كونه akisa‏ من jolas‏ المعلومات. وعلى النحو AlS‏ تهدف موسوعة 
ويكيبيديا (Wikipedia)‏ إلى أن تكون موسوعة دقيقة وموثوقة مثل الموسوعات الأخرى. 
وبطريقة مماثلة يتعين أن تكون البيانات المالية والبيانات الطبية دقيقة وصحيحة من أجل 
أن تغرس الثقة في نفوس التجار والأطباء والمرضى... والقائمة Johs‏ فمثل وجهة النظر هذه 
تفترض أيضا أن W‏ أصل البيانات وقضايا صحة وموثوقية البيانات ليست مهمة بالنسبة 
مستخدمي البيانات. 
وبغض النظر عن تسامح بعض مجموعات بيانات البيانات الكبيرة تجاه عدم «43JJl‏ إلا 
des ol‏ المعطيات الزيئة E555‏ إلى مخرجات زيئة iib Ls Ul V‏ فمجموعات البيانات 
الكبيرة التي تنشئ بيانات معيبة ورديئة» وتم التلاعب بها ومتحيزة: أو تنشئ بيانات ذات 
مصداقية diri‏ سوف تؤدي إلى تحليلات ونتائج DIS‏ مصداقيه ضعيفة وسوف OS‏ 
الفوائد المرجوة منها قليلة للغاية بالنسبة لهؤلاء الذين يحللون ويستفيدون منها. ويمكن 
للبيانات الكبيرة» عن طريق طرق إنتاجهاء أن تعاني من جميع العللء فالبيانات يمكن أن 
تكون معيبة ورديئة من خلال أخطاء SYI‏ حتى عبر التقنيات التي يفترض أن تكون ذات 
دقة عالية للغاية مثل نظام التموضع العالمي (GPS)‏ والذي تختلف دقته من جهاز لآخر 
وعدد الأقمار الصناعية المتوافرة في وقت معين من الأوقات )2013 (Dodge and Kitchin‏ 
أو من الممكن أن يكون قد تم التلاعب أو التزوير في البيانات من خلال حسابات مزورة أو 
القرصنة من أجل التأثير على الاتجاه العام وتوجيه العامة نحو مسارات محددة )2013 (Vis‏ 
فعلى سبيل JULI‏ هناك مئات الآلاف من الحسابات المزيفة على «jog‏ وهي تشكل ٤.٥‏ 
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من uz!‏ حسابات ال مستخدمين على تويتر )2013 (De Micheli and Stroppa‏ وأيضا فان 
حتى XEO‏ من حسابات بعض العلامات التجارية لمتابعي تويتر هي حسابات آلية Calzolari)‏ 
2012( وأكثر من درزنين من الخدمات تبيع حسابات تويتر مزيفة )2013 (Baym‏ 

فالبيانات يمكن أن تتسم بالتحيز جراء بعض الأسباب. إن الخصائص السكانية التي 
يتم اختيارها ف العينات نادرأ ما تكون شاملة وتتشوه إحصائيا من قبل الجنس: والنوع 
والدخل» والموقع: والعديد من العوامل الاجتماعية والاقتصادية الأخرى. فليس جميع 
الأشخاص يستخدمون تويتر أو الفيسبوك أو يتسوقون من محلات معينة» أو يكونوا 
مشتركين في شبكة الاتصالات ذاتها... Bollier 2010; Graham 2012; Crampton) eJ]‏ 
al 2012‏ ). فالتقنية المستخدمة وال معايير ال مطبقة 58 على طبيعة OLLI‏ فعلى 
سبيل المثال» مكن أن يتأثر تحديد المشاركات الأكثر قراءة أو مشاركة قان ,وسائل التواصل 
الاجتماعي بشكل كبير من خلال خوارزميات الترتيب وليس الاهتمامات البسيطة Baym)‏ 
Aeg .(2013‏ النحو 515« فإن واجهات برمجة التطبيقات تنظم ماهية البيانات التي يتم 
استخلاصهاء ففي تويتر على سبيل JEL‏ يتم التقاط الوسم المرتبط بالحدث وليس جميع 
التغريدات ذات الصله )2013 (Burns‏ وأيضنا فقد بين Gonzales - 821101 et al)‏ 
2) أن اختلاف طرق الوصول إلى بيانات تويتر - البحث في واجهات برمجة التطبيقات 
مقابل تدفق واجهات برمجة التطبيقات - يؤدي إلى الحصول على مجموعات مختلفة من 
النتائج. ونتيجة «JJ‏ لا توجد أي ضمانات بأن فريقين من الباحثين» على سبيل JELI‏ 
الذين يحاولون جمع البيانات ذاتها في الوقت ذاته سوف يكونون قادرين ف نهاية المطاف 
على الحصول على مجموعات السانات ذاتها )2013 .(Burns‏ وعلاوة على US‏ فإن اختبار 
البيانات الوصفية والمتغيرات التي يتم توليدها والبيانات الوصفيه وامتغيرات التي يتم 
تجاهلها يؤدي إلى رسم صورة معينة. ومثل هذه التحيزات تؤدي إلى انحراف أو حتى إلى 
نشوء أفكار واتجاهات وأشخاص ونماذج مستترة لم يتم تصويرها أو تمثيلها في مجموعة 
السسانات )2012 (Graham‏ 

وفيما يتعلق بمصداقية البيانات» فإن الحال لا يتمثل دوما في أن البيانات تعبر بصدق 
عما تم استخدام البيانات من أجل قياسه. فعلى سبيل JELI‏ هناك علامات استفهام 
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حول مدى حقيقة ودقة تعبير المشاركات في وسائل التواصل الاجتماعي عن وجهات نظر 
الأاشخاص» وعلى مدى (3959Jl‏ في مثل هذه المشاركات. وقد حذر (2011:6) Manovich‏ 
WG‏ إن «SIS LI"‏ والتغريدات» والصور التي تم تحميلهاء والتعليقات» وجميع الأشكال 
امختلفة من المشاركات على الإنترنت لا تعتبر نوافذ شفافه بذاتهاء وبدلا من 5« فهي Ut‏ 
مرتبة بعناية وتتم إدارتها بشكل منتظم وذلك من خلال الانتقادات نفسها التي تنطبق على 
سانات المقابلات ومجموعات التركيز" .(Focus Group)‏ وأبدى آخرون شكوكهم حيال 
صحه بيانات ele‏ ال مواطنة (Citizen Science)‏ والتعهيد الجماعيء وحذروا من جهل 
وعدم مقدرة الحشود على التنبؤ ومخاطر التفاوت (فيما يتعلق بالتغطية)ء والمتغيرات 
(فيما يتعلق بالجودة والتجانس)ء وتوليد البيانات المتحيزة المتأصلة في مشروعات المساواة 
الكبرىء التي تفتقر إلى القادة وتتشكل من مجموعة ضيقة من السكان ذوي التباين في 
ا مهارات والدوافع )2007 (Carr‏ وق الواقع» فإن وسائل التواصل الاجتماعي يهيمن عليها 
نخب رقمية غير ممثلة )2009 (Crutcher and Zook‏ في حين أن هناك مجموعات كبيرة 
من المجتمع مثل الفقراء وكبار السن لا ينخرطون في وسائل التواصل الاجتماعي أو يفتقرون 
إلى الهواتف ASII‏ ومن ثم فإن أي بيانات يتم جمعها لا تعكس بالضرورة وجهات نظر 
DETS‏ الأشخاص أو أحيائهم )2013 (Crawford‏ ومن ثم فمن الضروري للغاية أن يتم 
تحديد ووضع Jis‏ هذه التحيزات في الاعتبار وذلك عند تحليل البيانات من أجل كسب 
فهم أكثر شمولية للظاهرةء وخصوصا إذا ما كان سيتم استخدام مثل هذه البيانات في أعمال 
السياسة العامة والقرارات التي تؤثر على حياة الناس كالنتائج الصحية. 

وعلاوة على ذلك» يوجد بعض ال مخاوف بشأن جودة وتجانس ال محتوى والبيانات الوصفية 
التي تم تكوينها عبر أفراد متنوعي المهارات والدوافع» ومخاوف LAS olis‏ توفير درجات 
موتقة من الاعتمادية وتكوين إحساس بالمصداقية )2013 .(Dodge and Kitchin‏ وقد 
أدى هذا بالبعض إلى افتراض أن عمل التعهيد الجماعي "الهواة" سيكون إجراؤه بشكل 
أفضل إذا Jis‏ على تصحيح وتنويع البيانات ولیس على تكوين البيانات )2007 (Carr‏ 
فالمثال الذي ألقى Carr‏ الضوء عليه هو موسوعة ويكبيدياء إذ على الرغم من كونها 
شهيرة وشاملة: إلا أنها تتوسع بشكل غير مدروس ELE‏ الاهتمامات ال مختارة للمشاركينء 
ويوجد بها مقالات غير كاملة وأحيانا مكتوبة بلغة ركيكة وتافهة ومطعون في صحتها بشكل 
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كبيرء مما يبقوض zumo‏ وإمكانية استخدامها أو نفعها. وادعى Carr‏ أنه " إذا كانت 
موسوعة ويكيديا غير مجانيةء فمن غير ا محتمل أن قراءها سيكونون TER. 3S]‏ تجاه 
تلك "ogl‏ )2007:4(. ويمكن أن dhs p> bs‏ الطريق ال مفتوح (OpenStreetMap)‏ 
cs‏ التغطية في بعض الأماكن حيث يوجد عدد قليل من المتطوعين. ويوجد أيضا بعض 
المخاوف بشأن استدامة أعمال التعهيد الجماعي التطوعية» حيث ادعى 2007 Carr‏ أن 
الارتباطات التي تربط مجموعة افتراضية من الناس سويا عادة ما تكون ارتباطات undas‏ 
وهي تفتقر إلى العمق والالتزام الإجباري. وعادة ما تكون عرضة للتشتت» وهي تعتمد 
بشكل كبير على مجموعة أساسية صغيرة لكي تحافظ على سير المشروع وتوفر الجزء الأكبر 
من العمل. وعلى النقيض من eUS‏ لاحظ البعض أنه leu‏ يتعلق ب JOpenStreetMap‏ 
فإن جودة البيانات المقدمة تطابق جودة البيانات التى تقدمها الشركات الاحترافية وآن 
التغطبة متنوعة )2011 .(Haklay 2010, Mooney at al‏ 

فهذه المناقشة تلقي الضوء على أن كون مجموعة البيانات كبيرة للغاية من ناحية 
الحجم» فإن هذا لا يعني بالضرورة أنها عشوائية أو ممثلة للضاهرة أو صحيحة أو ذات 
مصداقية أو موثوقة. وكما لاحظ )2012( :boyd and Crawford‏ "کون السانات الكيرة 
تزودنا بكميات هائلة من البيانات» OB‏ هذا لا يعني أن القضايا ا منهجية لم تعد ذات 
صلة. ففهم العينة على سبيل «JULI‏ يعد أكثر أهمية الآن عما كان عليه الأمر في الماضي" 
(ص 668(. وبالنسبة ل )615 :2009( Kelling et al.‏ فإن هذه القضة تعتير قضية Lol‏ 
ومَنشأ أي "المعلومات المتعلقة Lob‏ وتعريف وملكية وبنية" مجموعة البيانات التي تمكن 
محللي هذه البيانات من معرفة كيفية تكوين هذه البيانات ومعالجتهاء وتمكنهم كذلك 
من تقييم جودة وصحة البيانات. وعلى e£ Jl‏ من «MS‏ فإن مصدر معظم مجموعات 
بيانات البيانات الكبيرة مقيد بهؤلاء الذين قاموا بإنشاء البيانات» مما يجعل من الصعوبة 
مكان تقييم صحة الدراسات المنشورة التي اعتمدت على هذه البيانات. فأحد التحديات 
الرئيسية التي تواجه البيانات الكبيرة يتمثل في المقدرة على معرفة تفاصيل سلالة الأصل 
والذي يشمل تقييمات مستويات الأخطاء والشكوك في مجموعة البيانات» وإنشاء وسائل 
فعالة للتحقق من وتنظيف ومعايرة البيانات عالية السرعة وشديدة التنوع. 
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:(Data Integration and DU aad دمج وتوافقية البيانات‎ 


إن أحد الوعود التي انبثقت عن 859 البيانات ES‏ انشاء مجموعات سانات ذات ترابط 
قوی مما مکن هذه bis A23 Ol e ENT‏ می Jel‏ إنشاء قيم ومعارف إضافية. 

وكما اتضح من خلال تطور البنى التحتية للبيانات ومدمجي البيانات» OB‏ العديد من 
البيانات عرضة لكى تندمج مع بعضهاء واتضح أيضًا أن الكثير من البيانات تظل منعزلة 
في مستودعات أو يمكن دمجها فقط من خلال معالجة إضافية كبيرة. ومن أجل أن يتم 
دمج البيانات في مجموعات بيانات جديدة: أو استخدام هذه البيانات بالاشتراك مع أي 
بيانات أخرىء» فإن هذه البيانات تتطلب حقول تأشيريه مشتركة وتوفر معايير البيانات» 
وبيانات وصفية متسقة. وتوافق على مستوى التنظيم والصيغة. وق حين أن تقدما كبيرا 
قد حدث ف إدارة البيانات وتطبيق معايير البيانات التي قادتها منظمات Jis‏ ال منظمة 
الدولية (ISO) yule‏ وزابطة الشبكة العالمية (W3C)‏ واتحاد اللعلومات المكانية 
المفتوحة (OGC)‏ فى سبيل المحاذاة بين البيانات والبيانات الوصفية وتحسين التوافق بين 
ا منصات duil‏ المختلفة التي تعالج البيانات وتحتفظ بهاء وتطوير البيانات المترابطة. 
إلا أن الكثير من مجموعات GU]‏ ©0 © رب بعضها ببعض. .فهي JS a5‏ ما أظلق 
عليه )2012( Singh‏ مصطلح "السانات الجانحة" .(Stranded Data)‏ 

إن معظم دراسات البيانات الصغيرة لا تزال 14:3( بيانات جانحة كونها تستخدم لغات 
توصيف خاصة بها وأنظمة تنظيم البيانات التي تناسب الأغراض التي سيستخدمونها فيها. 
ولكن القليل من هذه الدراسات تضع ف اعتبارها قضايا التوسع والربط. وهذه هي أيضا 
الحال غالبا داخل المنظمات التي يوجد بها إدارات منفصلة تستخدم أنظمتها الإدارية 
والتصنيفية الخاصة. فعلى سبيل «JUL‏ فإن JS‏ واحدة من هيئات التخطيط التي يبلغ 
عددها تمان وثمانين هيئة في إيرلندا تستخدم نظامها الخاص لاستخدام الأراضي وتصنيف 
المناطقء وعلاوة على ذلك. فهذه الهيئات توظف العديد من ال منصات التقنيه ال مختلفه 
لغرض إدارة وتخزين وتخطيط البيانات» فربط جميع هذه البيانات وتوحيدها قي نظام 
وطني واحد ليس dago‏ سهلة على الإطلاق. O bbg‏ توسيع مجموعات البيانات 
الوطنية سوف يواجه مشاكل مماثلة. فعلى سبيل «JULI‏ فإن ربط الإحصائيات السكانية 
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في إيرلندا وإيرلندا TA yo bear A MEET‏ اناك exl 532-13 as denso‏ 8,5 اليل 
NE‏ هنذا من التحديات الفنية وذلك يرجع إلى أن <٠١‏ من الأسئلة متطابقةء و٥٠‏ 
أخرى من الأسئلة ممكن أن يتم مضاهاتها وذلك من خلال تقسيم خطط التصنيف وإعادة 
تجميعها في الخطط المشتركة. وحتى إذا تم هذاء فإن البيانات ستكون ذات جغرافيات 
إحصائية ضمنية مختلفة يتم تجميعها في وحدات مختلفة الأحجام )2007 (Kitchin et al‏ 
وتتضاعف هذه القضايا عبر قارة أوروباء حيث تتبع JS‏ دولة وكل مؤسسة إجراءات 

مختلفة (وحدات (Clas‏ وتعتمد فترات 55 4 متفاوته (عدد المرات التي يتم فيها إنشاء 
البيانات). وتستند إلى أماكن متباعدة (الجغرافيا الإحصائية)» وتستعمل تقنيات مختلفة 
(الصيغ). ومن ثم فلقد استنتج )118 :2012( Rubert‏ أنه حتى مع وجود بيانات حكومية 
شاملة. إلا أنها في غالب الأحيان تتصارع تحت وطأة الأعداد التي لا تحدكى من مجموعات 
OLLI‏ المتضاربة وغير المتوافقة وغير الصالحة للمقارنة. وتسعى بعض المبادرات مثل 
توجيهات (INSPIRE) 2 aal‏ (البنية التحتية للمعلومات المكانية فى الملجتمع الآوروبي) 
إلى تكوين cU‏ مشتركة عير الجغرافيا الآوروبية الإاحصائية المشتركة:» ولكن الوصول إلى 
توافق في هذا WMM EE‏ إلى أن جميع الولايات لا ترغب 
في الانتقال بشكل أحادي (أي من طرف واحد) إلى نظام جديد للبيانات وخلال العملية 
يوقفون سجلاتهم الزمنية ويفقدون مقدرتهم على إجراء تحليلات زمنية متتاليةء إضافة 
إلى أن كل ولاية لها أولويات مختلفة فيما يتعلق بالبيانات التي ترغب في إنشائها وتتبعها. 
وتوجد هذه التحديات نفسها فيما يتعلق بالبيانات الكبيرةء والتي رها تكون غير 

متجانسة وغير منظمة بشكل كبير للغايةء ومتفاوتة فيما يتعلق بالجودةء وهي أيضا مرنة 
وقابله للتوسع. فربط وتجميع مثل هذه البيانات ليس dago‏ سهله على الإطلاق وهي 
تتطلب تطوير مجموعة جديدة من الأدوات والأساليب» وكذلك إنشاء وتبني معايير جديدة 
للبيانات. فأحد الحلول المطروحةء والذي أشار إليه )2011( Short et al‏ هو دمج البيانات 
المخصص والذي يمكن المستخدمين من التحكم بسرعة وبشكل مباشر في أي من البيانات 
التى سيتم دمجهاء وذلك على الرغم من أن هذا يتطلب أن تكون مجموعة البيانات تتمتع 
بسمات معينة مثل البنية التحتية الدلالية المؤثرة. إن ربط وتجميع مثل هذه البيانات 
مع alos el‏ يؤدي إلى sl‏ المتقاطع (Cross-Contamination)‏ بسبب البيانات 
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ذات الجودة الضعيفة والحالة المتهالكة مما يؤدي إلى فساد وتلويث مجموعات البيانات 
الفعالة ويحولها إلى مجموعات بيانات ضعيفة. ومع ازدياد طوفان البيانات» فإن إيجاد 
الحلول التى تساعد على دمج البيانات وتوحيدها وتحافظ على سلامتها وفعاليتها سيمثل 
قضية ملحة» وذلك على الرغم من أن عدم المقدرة على ربط البيانات له جوانب إيجابية 
أيضا وذلك فيما يتعلق بتقبيذ مراقبة البيانات وتحسين أمن البيانات (انظر الفصل العاش). 
التحليل الركىك وال مغالطات الى :(Poor Analysis and Ecological Fallacies)‏ 


جميع النتائج التي يتم التوصل إليها من الدراسات تكون دقيقة وسليمة وقوية بحسب 
البيانات التي تم استخدامها والتحليلات التي أجريّتء وإذا ما وضعنا جودة وصحة البيانات 
جاتباء فخلال تصميم أي بحث يكون من المهم للغاية استخدام منهجية ملائمة وآليات 
مناسبة. فالإخفاق في فعل ذلك سيؤدي إلى مغالطات dio‏ خطيرة عند تفسير النتائج: 
بمعنى استخلاض النتائج المضللة والتي في الواقع لا تدغمها البيانات المستخدمة. وهناك 
تاريخ طويل من ال مساجلات التي تتعلق بمكامن القوة والضعف النسبية في العديد من 
الأنماط والأساليب المنهجية المختلفةء والظروف التي يمكن فيها تطبيق مثل هذه الأنماط 
والأساليب بشكل صحيح. وعلى وجه العموم: هناك الآن إرشادات وقواعد محددة بشكل 
واضح تتعلق بكيفية تكوين وتحليل أنواع مختلفة من البيانات عبر أنظمة متعددة. وعلى 
الرغم من US‏ وفيما يتعلق بالبيانات uI‏ فإن علوم البيانات لا تزال في أطوارها 
التمهيدية. ومثل هذه المعايير لا تزال في طور التشكيل والصياغة. فآليات جديدة يتم الآن 
اختراعهاء وتوسيعهاء وتقييمها. 

وهناك أربع قضايا منهجية تتعلق بالبيانات الكبيرة جذبت الانتباه» فأولى هذه القضايا 
تتمثل في الإجابات المتفاوتة بشكل عميق والتي تؤدي إليها الافتراضات والمقاربات داخل 
النماذج )2012 (Silver‏ وثانياء مدى قدرة الآليات والأساليب المستخدمة على إحداث 
الاستسقاطء أي رؤية واستخلاص أنماط من البيانات العشوائية التي لا معنى لهاء أو إحداث 
فرط التعلم أو املاءمة (Overfitting)‏ والتی تحدث عندما يصف نموذج إحصاني خطأ 
عشوائننا أو ESE‏ بدلا من العلاقة الكامنة )2012 (boyd and Crawford‏ أو الخطاً 
في التعامل مع التشويش على أنه معلومات )2013 .(Silver 2012; Siegel‏ وثالث هذه 
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القضايا يتمثل في الاتهامات بأن بعض الآليات المعينة تؤدي إلى ما هو أكثر بقليل من 
تجرف السانات )2011 duly .(Data Dredging) (Webster‏ اذا كان بإمكان SUMI‏ 
أن تتوسع خارج نطاق بيانات ضبط الاختبار إلى مليارات السجلات المتدفقة في العام 
الواقعي )2008 (Bryant et al,‏ 


إن النماذج تهدف إلى توضيح والتعبير عن العلاقة بين المتغيرات وكيفية عمل النظام. 
فكل نموذج يتم تأسيسه على نظرية «duse‏ وبناؤه باستخدام مجموعة من الافتراضات 
والمقاربات التي تبين كيفية تفاعل المتغيرات» في حين أنه يتم اختبار صحة النموذج من 
خلال البحوث التجريبية: فإذا كانت النظرية والافتراضات غير صحيحة: فإن جميع التنبؤات 
ستكون غير صحيحة فى هذه الحالة كذلك» وحتى التغييرات الصغيرة للغاية على الافتراضات 
في نموذج هكن ما أن تؤدي إلى نتائج مختلفة تماما. ففى حالة الأزمة المالية العالمية التى 
حدثت ف العام 2008 ادعى )2012 (Silver‏ أن أحد العوامل المهمة للغاية في إحداث 
مثل هذه الأزمة كان استخدام نماذج تمويل دمجت ال مخاطر بحيث ممكن حساب احتمالية 
الدخل المحتمل مع الارتياب لأن المخاطر المحتملة من الصعب تقييمها. ونتيجة SUU‏ 
اعتمدت النماذج على افتراضات غير يقينية ولكن تم معاملتها كما لو كانت مخاطر معروفة 
على وجه اليقين. والنتيجة كانت افتراض أن السندات I‏ الجديدة التي يحيط بها 
ارتياب نظامي Jle‏ للغاية هى أصول ذات مخاظر منخفضة: liag‏ افتراض ثبت أنه خاطئ. 
às‏ الأنظمة المعقدة, فإن مثل هذه الأخطاء لا يتم قياسها على أساس درجات ولكن يتم 
قياسها على أساس ترتيبها حسب الأهمية. وقد قدرت مؤسسات ستاندرد أند بورز 333929 
(S&P and Moody's)‏ مخاطر التخلف عن الدفع والمرتبطهة بالتزامات الديون المضمونة 
(CDOS)‏ بأقل من قيمتها بعامل من مائتين )45 :2012 .(Silver‏ وبغض النظر عن جودة 
البيانات الضمنية: فإذا كان النموذج خاطئاء فأي نتائج يتم استخلاصها من هذا النموذج 
ستكون خاطئة كذلك. 

لقد افترض )2013( Granville (2013) and Taleb‏ أن لعنة أو مأساة السانات الكيرة 
مُضاعفة. نتيجة العلاقات الإيجابية الخاطئة بين البيانات؛ وأنماط مجموعات البيانات التى 
تكون عرضية بشكل 35 e‏ وليس لها أي قوى تنبؤية» ولا يمكن تكرارهاء وربما يمكن أن 
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تكون قناعا لنماذج أضعف ذات أهميةء فمجموعات البيانات تشتمل غالبا على البيانات 
التي يبدو أنها مرتبطة بعضها البعض» حتى ولو كانت العلاقة بينها عشوائية في الواقع. 
ومع زيادة حجم مجموعة البيانات» تتضاعف الأخطاء الإيجابية: إلى الحد الذى تكون فيه 
أي علاقة تقريبا بين البيانات مهمة من الناحية الإحصائية وفق معايير اختبارات الارتباط 
التقليدية )2013 .(Pentland 2012; Rajaraman et al. 2012; Taleb‏ وعلى النحو ذاتهء 
ففي أساليب التنقيب عن البيانات» مثل شجرة القرارات (تسلسل اتخاذ القرار)» هكن أن 
يتسم النموذج بفرط الملاءمة S‏ يتم استنباط نتائج استثنائية تحول إلى نتائج قابلة للتعميم 
مما يؤدي هذا إلى حدوث مغالطات بيئية. فالبيانات الكبيرة في هذه الحالة لا تعنى معرفة 
أفضلء ولكنها تعني بالأحرى ارتباكا أكثر وذلك من جراء صعوبة تحديد دالة حقيقية وسط 
ركام من الدلالات. ولذا فإنه: " أحيانا يكون الأقل هو الأقوى تأثيرا" Verhulst)‏ تم الاقتباس 
من 2012:14 .(Bollier‏ 


إن أحد الجوانب المهمة في مشكلة الأخطاء الإيجابية ليس حجم مجموعة البيانات 
فحسب» بل كيفية معالجة وتحليل مجموعة البيانات هذه. فأحد أجزاء إستراتيجية الكثير 
من تحليلات البيانات الكبيرة يتمشل في فحص مجموعة البيانات قبل صياغة الافتراضات 
(انظر الفصل السادس).: ومن الطرق المتبعة للقيام بهذا الأمر حساب الارتباطات بين 
جميع المتغيرات Wig‏ من أجل تحديد العلاقات المحتملة بين البيانات الجديرة بالدراسة 
الإضافية. وتشكل هذه العملية ما يعرف بتجريف البيانات (Data Dredging)‏ والتى 
تسمى أحيانا تصيد البيانات» وهي ممارسة لا يحبذها بشدة الكثير من الخبراء الإحصائيين 
(Webster 2011; Piatetsky-Shapiro 2012)‏ فا مشكلة التي ترتبط بهذا المنحى 
مشكلة مزدوجه. فمن am‏ هی تحدد آلاف الأخطاء الايجابية المحتملة وذلك دون 
تحديد آي من هذه الأخطاء عشوائي slo‏ منها ذو مغزى. ومن جهة أخرىء يمكن أن تؤدي 
إلى التنقل من متجر لآخر طلبا للأرخض وعرض النتائج التي تؤكد اعتقاد diabl‏ مع وجود 
دليل من التحليل ا مستخدم من أجل أن يجعل الادعاء يبدو Webster) lasis Noise‏ 
Taleb 2013‏ ;2011(. فالسؤال الشاتك الذي يطرح نفسه هناء كما أشار Granville)‏ 
2013( هو كيف ممكن التمييز بين ilo‏ حقيقية Ilog‏ عرضية hug‏ الكميات الهائلة من 
البيانات؟ وكيف ممكن ألا ينقاد المرء للاستسقاط وفرط التعلم؟ 
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إن هناك بعض الحلول الممكنة. حيث اقترح )2015( Rajaraman et al.‏ استخدام 
مبدأ بونفیرونی (Bonferroni)‏ والذي يسعى إلى تحديد الأحداث النادرة جدا لدرجة أنها 
لا يمكن أن تحدث ف البيانات العشوائية. وذلك من أجل فرز الارتباطات الفعلية عن 
الارتىاطات العشواشة. كما كان )2013( Lusk‏ من أنصار استخدام مستويات ds juo‏ 
معززة. وذكر نقطه انطلاق معيار duas‏ سيجما (Five Sigma)‏ ا مستخدم Wb‏ في الفيزياء 
من أجل مواجهة الارتباطات الوهمية وإعلان الاكتشافات (احتمال كون النتائج خاطئة 
وناتجة عن التغيرات الإحصائية فقط هو واحد في كل ثلاثة ملايين وخمسمئة آلف أو 
٠‏ .). ومن الحلول المطروحة الأخرى هو التحقق الإضاف من خلال مجموعات 
بيانات أخرىء أو التقسيم العشوان للجموعة البيانات الحالية إلى عينات ومعرفة إذا ما 
كانت العلاقة أو الارتباط سيظل issu‏ عبر العبنات )2000 .(Jensen‏ وفيما يتعلق 
بفرط التعلم» ناقش )2010( Miller‏ إستراتيجية استخدام الخلفية المعرفية: والتى تتكون 
من استخدام الحقائق المعروفة عن مجموعة بيانات مستقاة من الافتراضات عن النظام 
والحقائق الملاحظة: ومعرفة الخبيرء أو النظرية: أو المقاييس الممتعة والمرغوب فيها التي 
تقيم البساطة والتيقن والفائدة والحداثة DEU‏ المستحدثة. وذلك من أجل فصل الأنماط 
الهادفة عن التشويش. وعلى الرغم من EUS‏ فمن الواضح أن هناك حاجة لبذل أعمال 
إضافية من أجل تطوير أساليت لتقييم المغزى والدلالة. في عصر البيانات الكبيرة. 

وإذا وضعنا في الاعتبار أن تحليلات البيانات لا تزال في مراحلها الأولى من التطورء وتم 
تطبيقها بالدرجة الأولى على بيانات الضبط والاختبارء يظل أيضا هناك بعض المخاوف 
بشأن فعالية مثل هذه الأساليب في مجاراة البيانات الفوضوية وغير المنضبطة. وكما أشار 
Byrant et al. (2008: 4)‏ فإن "الكثير من الخوارزميات لا gwg‏ خارج نطاق مجموعات 
البيانات التي تتكون من بضعة ملايين من العناصرء أو لا يمكنها أن تتحمل التشويش 
والثغرات الإحصائية الموجودة في بيانات العام الواقعي". فإذا كان هناك آي اختلالات أو 
تحيزات موجودة في الخوارزميات» فمن شأنها أن تؤدي إلى انحراف النتائج وتفسيرات هذه 
النتائج )2012 .(byoed and Crawford‏ ويرتبط بهذا التخوف أيضا القلق من أن هناك 
اعتمادا TRY‏ والكثير lae‏ من الموثوقية ال موضوعة في الخوارزميات وذلك من أجل إجراء 
التحليلات» واستخراج المنافع والمزايا التي تجلبها الخبرات وا معارف والفطرة البشرية من 
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d‏ فهم ظاهرة ما )2012 (Lohr‏ ومن ثم: هناك حاجة لإجراء المزيد من العمل من 
أجل تأسيس وتقييم صحة التحليلات الجديدة والثقة في النتائج التي يمكن استخلاصها من 
هذه التحليلات. 

ومن الانتقادات الأخرى الموجهة إلى تحليلات البيانات الكييرة هو تركيز هذه OLI‏ 
على الانية (هنا (Ig‏ وذلك بالنظر إلى حداثتهاء وعلى وجه العموم» فإن البيانات الكبيرة 
تفتقر إلى العمق التاريخي. فشبكات الاستشعار الجديدة أو بيانات التعهيد الجماعي يمكن 
أن توفر بيانات مستمرة وثرية» ولكنها تتسم بقصر الفترات الزمنية التي تغطيها. وننيجة 
لذلكء فإن الكثير من التحليلات تكون مناسبة في وقتها ولكنها تفتقر إلى العمق الزمني 
هذا امع 365 sod aid:‏ اذا OUS‏ الف lk ais‏ بالوقت الحاضر بتتبع حدث 
ممتد باستخدام وسائل التواصل الاجتماعي (على سبيل المثال حدث سياسي كبير مثل الربيع 
العربي)؛ أو أن يكون الشخص UB‏ بتحليل عملية مادية لا تتغير مرور الوقت (مثل تجربة 
فبزدائتة)/ولكن سىكون الذمر ا للمشاكل I5]‏ تم استخدامه من أجل فهم العمليات 
التي azz‏ لآلاف السنين أو ASÍ‏ (على سبيل JULI‏ الأنظمة البيئية والجيولوجية). وينطبق 
هذا الانتقاد أيضاء بالطبع» على دراسات البيانات الصغيرةء والتى تعتبر أيضا لقطات تم 
اتخاذها في أماكن معينة وأوقات محددة. 


المهارات والموارد البشرية :(Skills and Human Resourcing)‏ 
في حين أن بعض تحليلات البيانات يتم تركها للخوارزميات» وخاصة العمل المتعمق 
للمعالجة والحسابات. إلا أن أعمال التوجيه والتفسير لا تزال إلى حد كبير حكرا على المحليين 
النشر. فبالاعتماد على ارام وخبراتهم ومعارفهم» يتخذ الباحثون والمحللون القرارات 
المتعلقة بالأماكن المثلى التي ينبغى التركيز عليهاء وكيفية صياغة وإجراء التحاليل» وإدراك 
المراد من النتائج والعمل على هذه النتائج. فالبشر يظلون هم الفاعلين الأساسيين في تأسيس 
وتشغيل والمحافظة على المشروعات التي تقودها البيانات» فعلى سبيل «JUL‏ يتطلب تأسيس 

بنية تحتية للبيانات مهندسي برامج وأجهزة ومسئولين رقميين: وأخصائيين في السياسة وخبراء 
محالات علميه ومحللين. فهؤلاء العاملون يضمنون Ie bud‏ للنظام د ينتج بيانات 
مفيدة وصحيحة 4353529 ويوفرون الوسائل الضرورية لتخزين ومشاركة البيانات» ويؤمنون 
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مجموعة من الأدوات التحليلية والإدارية المناسبة» التي يمكنها استخلاص القيمة والمعرفة. 
وهم يعرفون أيضا ماهية الأسئلة التي ينبغي توجيهها وما الذي يتعين فعله بالإجابات على تلك 
الأسئلة. ولذاء فإن المواهب البشرية بضاعة رائجة. ولكن وكما أشارت بعض التقاريرء هناك 
نقص متزايد في الموظفين الذين يتمتعون بمهارات في البيانات وخاصة محللي ومديري البيانات 
الذين بإمكانهم تحويل البيانات وال معلومات إلى معارف وعلوم );2011 Gantz and Reinsel‏ 
.(Manyika et al. 2011; Shah et al. 2012; Rooney 2‏ 


وقد أكد )2012:3( Manyika et al.‏ " أن الولايات المتحدة وحدها تعاني نقصًا يبلغ 
٠‏ إلى ١1١.٠٠٠‏ شخص بتمتعون مهارات تحليلية متعمقة وكذلك 1,0 مليون مدير 
ومحلل من أجل تحليل البيانات الكبيرة واتخاذ القرارات بناء على اكتشافاتهم". واستطردوا 
بالإشارة إلى أن Jis‏ هذه المواهب "من الصعب إيجادها إذ تستغرق سنوات عديدة في 
التدريب أو إعادة التدريب" (ص .)٠١‏ وقيم )2012( Shah etal.‏ عدد ***0 موظف في 
اثنتي عشرة شركه dlle‏ فيما يتعلق بمقدرتهم على معالجة تحليلات البيانات بشكل مثمر 
حيث قاموا بوضع الموظفين في ثلاث مجموعات. الأولى» التجريبيون غير المعترضين الذين 
يثقون في التحليلات أكثر من الأحكام الشخصية (XEF)‏ والثانيةء متخذو القرار المتعمقون 
الذين يتجاهلون التحليلات ويتصرفون ما يليه عليه حدسهم الفطري )413( والثالثه» 
المتشككون المطلعون (FA)‏ الذين يوازنون بين الأحكام الشخصية والتحليلات. ويسعون 
إلى تفسير البيانات ووضعها قي سياقها المناسب عند اتخاذ القرارات. وبشكل مقلقء فإن 
اولئك الذين يدعون البيانات تعبر عن نفسها واولئك الذين يتجاهلون البيانات والتحليلات 
بشكل روتيني يفوقون في عددهم أولثك القادرين بشكل أفضل على فهم البيانات الكبيرة. 
وعلاوة على ذلك لاحظوا أن الشركات تعاني من أربعة مشاكل تحول دون الاستفادة من 
إمكانيات البيانات الكبيرة وهي: 
٠‏ أولا: أن المهارات التحليلية تتركز في عدد محدود للغاية من الموظفين ولا تنتشر في باقي 
الموظفين. 
٠‏ ثانيا: أن حلول تقنية المعلومات تتركز بشكل تقليدي على التقنية وبشكل أقل بكثير على 
امعلومات 3 حين أن امعلومات هي المجال الذي يتم من خلاله جني القيمة. 
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٠‏ ثالثا: أن تخزين البيانات يحدث كيفما اتفق ومن الصعوبة بمكان على أي موظف أن 
يحدد مكان امادة إذا م يكن هذا الموظف هو ال مسئول عن جمعها. 
$ رابعا: أن المديرين يفهمون قيمة الموهبة ورأس JUL‏ والعلامة التجاريةء ولكن لا يفهمون 
قيمة المعلومات» ولا يبذلون lasar‏ كافية من أجل فهم البيانات أو ترتيب هذه 
LUI‏ بشكل فعال وكفاء. 
ويوجد مثل هذا النقص ف المهارات أيضا في المؤسسات الأكادهية» حيث إن خبراء 
المجالات المختلفة تدربوا في وقت ندرة البيانات وهم غير مستعدين بشكل كبير لعصر 
البنى التحتية للبيانات والبيانات الكبيرة وذلك باستثناء عدد لا يتجاوز أصابع اليد الواحدة 
من العلماء وا مراكز. 
إن القلق الذي ينتاب الكثير من المعلقين هو أن المنافع االمحتملة من الشركات والعلوم 
التي تقودها البيانات لن يتم تخقيقها بشكل Jal‏ بسبب نقص المواهب البشرية وخاصة 
علماء البيانات الذين تجتمع لديهم مهارات مبرمجي البرامج والإحصائيين والرواة المحترفين 
وذلك من أجل استخلاص شذرات الذهب المختبئة تحت جبال من البيانات Cukier)‏ 
co otis (2010‏ الذين تفهمون كيفية ولل هذه القتذرات إل قرازات حخكمة. وفيها 
يتعلق بالمديرينء Ss‏ أشار )23 :2012( Shah et al.‏ فإن "الاستثمار في التحليلات يمكن 
أن يكون بلا 5922« ويمكن حتى أن يكون ضارا إلا إذا كان بإمكان الموظفين دمج هذه 
البيانات في العملية المعقدة لاتخاذ القرارات". فالجامعات بدأت الآن في إنشاء برامج 
جديدة ومراكز بحثية لعلوم البيانات» ويسعون إلى تعديل الدورات التدريبية الحالية لي 
تشتمل على التدريب على مجموعة المهارات الجديدة cod‏ وذلك في مسعى إلى تنقيح 
بعض الثغرات المتعلقة بالمهارات. ويتم تنظيم بعض هذه البرامج بالمشاركة مع بعض 
الشركات. فعلى سبيل colo JEL‏ شركة آي بي (IBM) e!‏ بالفعل في العمل مع العديد من 
الجامعات من أجل تطوير دورات ومقررات تعليميةء وهناك بعض الشركات الأخرى مثل 
شركة تيبراداتا (Teradata)‏ التي تقدم برامج تدرسة معتمدة من الجامعات Bertolucci)‏ 
2013( وذلك على الرغم من أن هذه البرامج من الممكن أن تؤدي إلى مخاطرة توجيه 
الطلاب تجاه رؤى وبرامج خاصة ببعض الشركات. 
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الجدول رقم ١(‏ - 3( 


الفصل التاسع 


الخبرات اللازمة لبناء الىنى التحتية للسانات وإجراء بحوث السانات الكميرة 


ALaJI بالمجال (المجالات) ذات‎ dinas معرفة نظرية وعمليه‎ o 

o‏ المعرفة التامة بأنواع البيانات التي ستتم دراستها وأصل هذه البيانات 
وأهميتها للمجال (المجالات) ذات الصلة. 

o‏ المقدرة على تحديد الفجوات المعرفية. 

e‏ المعرفة التامة بالأدبيات والاتفاقيات النظامية. 

o‏ المقدرة على تعليم الآخرين الذين ملكون خلفيات متعددة من أجل 
استيعاب كل ما ذكر „Mel‏ 

٠‏ فهم كيف يتم تجميع البيانات وال محافظة عليهاء وكذلك فهم العلاقات 
بين الأشياء المادية والتمثيل الرقمي لهذه الأشياء (إذا كان ذلك ممكنا). 

e‏ المعرفة التامة بنماذج البيانات و/ أو اتفاقيات وصف البيانات. 

o‏ فهم كيف يتم الوصول إلى البيانات ذات الصلة وتخزين هذه البيانات. 

« المقدرة على تسهيل مشاركة البيانات وتصحيح الأخطاء بشكل $942« 
سواء كان هذا أثناء el‏ بعد المشروع. 

e‏ المقدرة على jal‏ بالاستخدامات AL az‏ أو البديلة للسانات. 

e‏ فهم الأشكال الجديدة من ال مطبوعات التي يمكنها أن تحتوي على البيانات. 


o‏ فهم نقاط القوة والضعف فى أدوات البحث الفردية. 

e‏ اختيار وتعديل الأدوات المناسبة لدعم الأهداف البحثية. 

yl التنبؤ بالمشاكل التي يمكنها أن تنشأ مع استخدام الأدوات‎ e 
لتنفيذ مهام المشروع.‎ 


o‏ توقع واكتشاف معدلات الأخطاء في خوارزميات البيانات وتحليلات 
البيانات» واختيار الطرق الإحصائية التي تفسر هذه الأخطاء كلما كان 
ذلك Lalis‏ 

٠‏ تعليم الآخرين LAS‏ تفسير نتائج البحث. 





خيرات المجال 


Domain Expertise 


خيرات السانات 


Data Expertise 


ldall الخبرات‎ 
Analytical Expertise 
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القضايا duill‏ والتنظيمية 


E‏ امقدرة على délas‏ معام اطمشروع. 
ALI o‏ 84 على تحديد الأهداف المناسبة وامواعيد النهائية وتنسيق 
مسارات العمل امتوازية إذا كان ذلك ضروريا. 


خيرات إدارة ا مشاريع 


Project Management 


expertise 


o‏ المقدرة على اختبار أفضل الإستراتيجيات المناسبة للاتصال والتوثيق 


للمشروع. 

o‏ إجادة الأدوات odl‏ التعاونية. 

٠‏ الإرادة القوية للعمل من أجل تحقيق النتائج التي تفيد جميع أعضاء 
الفريق. 


. Williford and Henry (2012: 16 - 20) امصدر: مقس من‎ 


إن عم البيانات ليس هو الخبرة الوحيدة التي يتعين تأسيسها. وبحسب ما ادعى 
Olè Williford and Henry (2012)‏ تأسيس بنى تحتية للسانات وإجراء البحوث على 
البيانات الكبيرة يتطلبان دمج أربعة أنواع من الخبرات من أجل تحقيق النجاح (انظر 
الجدول .)4-١‏ وهذه الخبرات الأربعة كما ادعى )2013( Rubert‏ يمكن أن يتم تحقيقها 
فقط من خلال منهج متعدد التخصصات والقطاعات. مما يسمح بتوحيد المهارات والرؤى 
التي يمكنها أن تتقاطع مع المجالات وتحقق التعاون بين المؤسسات الأكاديمية والصناعية 
والحكومية. وحتى b‏ مثل هذا الوقت» أي عندما يتطور وينضج جيل جديد من ال مواهب 
ا مناسبةء وتتطور مناهج متعددة المجالات والأنظمة: فإن المشروعات ستظل عرضة للإخفاق 
أو سوء الأداء. 





الخاتمة: 

كشف هذا الفصل عن أوجه النقص الفنية ف البيانات الصغيرة المتوسعة والبيانات 
الكبيرة. وناقش أن البيانات الكبيرة تحيط بها العديد من القضايا التي تحول دون الاستفادة 
منها وتطويرها في الوقت الراهنء ومن هذه القضايا على سبيل الذكر لا الحصر النطاق 
الضيق إلى حد ما لمجموعات البيانات المتوافرة. والوصول المحدود إلى GLL‏ والجودة 
الضعيفة OLLU‏ وصحة وموثوقية البيانات» وسلالة Lol‏ السانات المحددة بشكل سيئ؛ 
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الفصل التاسع 


والشادلية الضعفة» والتحليلات المشكوك as‏ والمغالطات di‏ وقاعدة المهارات المطورة 
بشكل ضعيفء والاستجابة المؤسسية. وقد gol‏ ذلك ب )2012( Dembosky et al.‏ 
للادعاء Sb‏ "التحركات الأولية رما تكون واعدة بشكل مفرط ولكن أداءها رما يكون أقل 
من لوقع وخضوضا عتدما يضبح Va‏ آلذين يتبتون جلول البياثات الكبيرة "متجمين 
بسبب التقنية التي لا تزال حديثة للغاية وغير منقحة» فالتقنية أضحت مرهقة ومثبطة 
أكثر من كونها مفيدة". وبمرور الوقت» فإن الكثير من هذه القضايا سيتم التعامل معها إلى 
حد ما وذلك من خلال الحلول الإدارية والفنية؛ ولكن ستظل هذه القضايا تشكل مخاوف 
وتتطلب اهتماما Macs TC‏ افوا متحددا. وينطبق الأمر ذاته Là‏ على مشروعات 
البنى التحتية للبيانات ومشروعات البيانات ا مفتوحة. وف الواقع وكما أشرنا إلى ذلك في 
الفصل الثالثء فإن الكثير من هذه القضايا التي تؤثر على البيانات الكبيرة تؤثر بشدة في 
مشروعات البيانات المفتوحة. فعلى سبيل «JULI‏ فإن yaw‏ مواقع البيانات ال مفتوحة لا تعد 
أكثر من كونها مقالب نفايات للبيانات ذات المتغيرات الانتقائية» إذ إن هذه المواقع منظمة 
بشكل سيئ للغاية وهي ذات بنية ضعيفة تماما وبياناتها غير نظيفة» وهي تفتقر إلى 
مجموعات التسجيل الكاملةء والتوثيق» والسياسات المتعلقة بالحفظء والنسخ الاحتياطيء» 
والتدقيق» وإعادة الاستخدام: والخصوصية والسياسات الأخلاقية. 

فنحن يتعين علينا أن نكون حريصين للغاية من أجل أن ندرك أن ثورة البيانات لا تزال 
في أطوارها التمهيدية وهي تتمتع بخصائص الجنين فيما يتعلق بالنضج والتطور, وفي الوقت 
الراهنء يبدو أن التسابق يتجه نحو طرح نظم تهدف إلى استعراض الإمكانيات وتأمين حصة 
سوقية مبكرة دون بذل الجهد الكافي لتفحص المصداقية والفعالية واممنفعة» أو لتفحص 
القضايا الإدارية واموارد البشريه التي تتعلق بالجاهزيه المؤسسية ومجموعات المهارات 
المناسبة. وف الواقع» فإن شعار بعض ال مشروعات هو أن تتجه نحو ما هو مستهجن بشكل 
مبكر ثم تتعامل مع القضايا التي Us‏ على أساس انتشارها. 

ونتيجة «UJ‏ فإن البحوث المركزة بشكل كبير والمصممة من أجل تحديد طبيعة ومدى 
أوجه القصور الفنية وا مؤسسية للبيانات الكبيرة والسانات المفتوحة والبنى التحتية للبيانات 
لا تزال متأخرة بشكل واضح مقارنة بأعمال التطوير الأخرى. ولكن مثل هذه البحوث 
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القضايا الفنية والتنظيمية 


تظل حيوية للغاية لإنشاء أنظمة eau‏ اكتشافات ونتائج صحيحة» ومن شأنها أيضا أن 
تضيف قيمه 4,36 للمؤسسات التي تتبنى وتستخدم هذه البحوث. ويتعين Ol‏ يتم إجراء 
هذه البحوث عبر قطاعات متعددة yeg‏ الأنواع المختلفة من البيانات وذلك من أجل 
تأسيس القضايا والحلول المتعلقة بالبيانات والأنظمة المختلفة. وعلاوة على eUS‏ يتعين أن 
يتم تخصيص استثمارات من أجل زيادة وصقل مهارات الموظفين الحاليين وتدريب جيل 
جديد من علماء «DULL‏ ودون إجراء مثل هذه Sgal‏ فإن GII SOLLI‏ والسانات 
المفتوحة والبنى التحتية OLLU‏ رها ستعاني أضرار السمعة التي ستؤدي في نهاية المطاف 
إلى بطء في نشرها وتبنيها. وهناك مجموعة أخرى من القضايا التي ستؤدي الدور ذاته 
وهي القضايا المتعلقة بالآثار الأخلاقية والاجتماعية والسياسية لأنظمة البيانات الجديدة 
وهو ما يركز عليه Lail‏ التالي. 
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الفصل العاشر 


(Ethical, Political, Social, and Legal Concerns) 


كما نوقش في الفصل السابع» يتم تكوين وتوظيف البيانات للعديد من الغايات التي 
تشمل حكم ال مجتمعاتء وإدارة المنظمات» والتوسع ف الأرباح» وتنظيم الأماكن. وف جميع 
هذه الحالات» A55‏ البيانات مدخلات أساسية à‏ الأنظمة التي يتم تنفيذهاء للمفارقه»ء لغرض 
أن تكون ا Er‏ أماناء وأمناء وتنافسية, «do L3]‏ وكفاءق .واظقافية. ومساءلة: على 
الرغم من أنه يتم القيام بذلك من خلال العمليات التي تراقب وتفرض النظام» وتكبح» 
339« 239( وتستغل الناس. فهناك توازن دقيقء في هذه الحالةء بين استخدام البيانات 
بطرق تحريرية وتمكينية» وبين استخدام البيانات من أجل تحقيق أغراض الفرد الشخصية 
وإلحاق الضرر بالآخرينء أو استخدام البيانات بظرق تتعارض مع رغبات هؤلاء الذين 
تمثلهم هذه البيانات. ولا يتعلق الأمرء مع ذلك: ob‏ تستخدم البيانات ببساطة في أشياء 
جيدة أو أشياء سيئة: فالمشكلة أعقد من ذلك بكثيز. وفي غالب الأحيان فإن النتائج التي 
تظهر على أنها متعارضة يتم تجميعها سويا لدرجة أن الأشخاص هكن تحريرهم أو إجبارهم 
في الوقت نفسه - وهم يحصلون على منافع شخصية في الوقت ذاته الذي يقعون فيه 
في مصيدة النظام الذي يسعى إلى تحقيق مكاسب من وراء مشاركتهم. وفي مصطلحات 
Althusser (1971)‏ تعمل dis‏ هذه الترتبات من خلال الاستجواب» وتوريط wlll‏ عن 
طريق منطقها وذلك من خلال الإقناع والحوافز. فعلى سبيل JELI‏ تمنح بطاقات الولاء في 
الأسواق Mal‏ خصومات ف الوقت ذاته الذي تعمل هذه البطاقات على تأسيس الولاء 
تجاه المتجر وتكوين قدر من البيانات التي يتم استخدامها من أجل محاولة بيع المزيد من 
البضائع لهؤلاء العملاءء مما يؤدي إلى زيادة الأرباح. وبا مثل: فإن تمن حصولك على الأمان 
من الهجمات الإرهابية هو المراقبة التي تنتهك خصوصيات جميع الأفراد في المجتمع» حيث 
Las‏ المواطنون على الأمان مقابل خصوصيتهم. 
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الفصل العاشر 


إن تكوين البيانات والعمل الذي تقوم به مثل هذه البيانات محاط بشكل جوهري 
مخاوف أخلاقية: واجتماعية» وسياسية. ومثل هذه المخاوف كانت لوقت طويل مثار 
إدراك ومجادلات Jalo‏ المنتديات العامة والمنتديات العلمية: مما gol‏ إلى صياغة مجموعة 
كبيرة من الإرشادات الأخلاقية والمهنية والتشريعات التي تحدد كيف يتم إنتاج إدارة, 
مشاركة» واستخدام البيانات. فليس هناك أي شكل من أشكال إنتاج وتحليل البيانات خال 
من مثل هذه ال مخاوف» وحتى المشاريع العلمية التي يبدو من الناحية الظاهرية أنها غير 
خطرة ومحايدةء يمكن أن تثير أسئلة أخلاقية ويكون لها توابع اجتماعية وسياسية. فعلى 
alb sag Le) «JEU aea‏ آن قياس tad] d alil glas‏ يكون شم ed) dle‏ 
الظواهر الطبيعيةء ولكن من الممكن أن يتم استخدام ذلك أيضا في تشكيل السياسات التي 
تؤثر ف حياة الناس داخل Jis‏ هذه الأنظمة. إن مثل هذه الحوارات الأخلاقية مستمرة 
وتتطور واحدة تلو الأخرى مع المجال الاستطرادي الأشمل الذي يتعلق بالاتجاهات والاراء 
الاجتماعية. وتطور التقنيات الجديدة. وفيما يتعلق بالأخيرة» فإن توسيع البيانات الصغيرة 
داخل البنى التحتية للبيانات. وإنشاء سوق البيانات الهائل» وفتح البيانات المؤسسية› 
وتدفقات البيانات الكبيرة بطرحان آسئلة أساسية أخلاقية. واجتماعيةء وسياسية: إذ إنها 
تعدل بشكل جذري مشهد البيانات. إن حجم وتنوع البيانات التي يتم تكوينها عن جميع 
مجالات الحياة اليومية والعام الذي نعيش فيه اليوم ينموان بشكل yho‏ وهذه البيانات 
هي أكثر من أي وقت مضى من حيث مناسبة توقيتهاء وتصميمهاء وشموليتهاء وترابطها. 
فما کان à‏ الماضي IPAP | AE‏ أصبح الآن وبشكل متزايد مكشوفا أمام مجموعة 
متنوعة من المصالح» وعمليات اتخاذ القرار داخل الحكومات» وأصبحت الأعمال توجه 
بالبيانات بشكل SÍ‏ ومدعومة بالدليل وأكثر اعتمادا على التقنية (تكنوقراطية). 

يناقش هذا الفصل مجموعة مختارة من المخاوف الأخلاقية, والاجتماعيةء والسياسية؛ 
والقانونية التي تثيرها ثورة البيانات» وهذه المخاوف تشمل مراقبة البيانات وتعقب 
البيانات» والخصوصية» وأمن البيانات» والتشخيص. والتصنيف الاجتماعي والخطوط 
الحمراء (Redlining)‏ والتي تعني ممارسة الحرمان أو زيادة التكلفة في الخدمات لمناطق 
لها غالبية عرقية محددة بناء على البيانات» والتحكم في الانسلالء والحوكمة التوقعية 
وحوكمة المؤسسات, والاعتماد التام على التقنية وحوكمة الشركات والإغلاق التقنيء» والملكية 
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وحقوق الملكيه الفكرية. فالفصل يناقش كيفية التفكير في كل قضية من هذه القضاياء مع 
الآراء المتباينة داخل كل ele‏ على حدة وبين العلوم المختلفة بعضها البعض» وكذلك داخل 
وبين الشركات والحكومات وا مجتمع Gabl‏ ومن لديه أجندات مختلفة» ومصالح مكتسبة 
وجساسيات سياسية. dy‏ فإنه لاتوجد إجابات Jod dla o‏ هذه القضايا التي (Ls‏ 
هذا الفصلء في حين أن الحلول تتكون دوما من تسويات وحلول وسط. ومن المؤكد. على 
ماذكرناء أنه كلما تنتشر ثورة البيانات» فمن ال مرجح أن تزداد حدة المناقشات والجدال 
بشأن هذه المخاوف. فخا عند القيام محاولات من أجل صياغة تشريعات جديدة 
للتعامل مع التطورات التقنية التي تساعد على انبثاق طرق جديدة لإنشاء وتعزيز وتحليل 
البيانات» ومن ثم تؤدي إلى ظهور LLAS‏ جديدة مما يجعل من التشريعات والقوانين 
القديمة تشريعات وقوانين عفا عليها الزمن. 


:(Data Shadows and Dataveillance) تعقب السانات ومراقبة البيانات‎ 

كما ناقشنا في الفضول السابقة» يتم تكوين كمية هائلة من البيانات في الوقت الراهن 
وذلك فيما يتعلق بال مواطنين في جميع ولايات الدولة. إن إنتاج وتحويل مثل هذه الكمية 
من البيانات ينمو ويتزايد باطراد» حيث تسعى الدولة والشركات ومنظمات ال مجتمع ا مدني 
بشكل فعال للحصول على البيانات المتعلقة مواطنيهم وعملائهم والأعضاء المشتركين في 
أنشصطتهم. وف الواقع. أصبح من الصعوبة بمكان أن يؤدي الفرد جزءًا من حياته اليومية 
دون أن يترك أثرًا لذلك بسبب الدور غير المباشر للتقنيات الرقمية والبرامج واستخدام 
امعرفات الدالية )2011 .(Kitchin and Dodge‏ فحتى ولو م يقم المشتري باستخدام 
بطاقته الائتمانية لشراء البضائع من المتاجرء إلا أن حضور هذا المشتري قد تم تسج 
من خلال كاميرات المراقبة» وحتى لو استخدم الشخص اسم مستخدم مجهول على وسائل 
التواصل الاجتماعي فإنه يتم تسجيل عنوان بروتوكول الإنترنت (IP Address)‏ وعنوان 
التحكم بالوصول (MAC Address) JL asl‏ ومن ثم فنحن نترك آثار البيانات بشكل 
روتيني في أعقابناء على es JI‏ من أننا في الغالب لا نمتلك السيطرة الكاملة على شكل ومدى 
وكيفية استخدام هذه الاثار. 
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Ss‏ أشار )2011( Koops‏ على سبل «JULI‏ فان äis‏ حمابة السانات الهولندية 
قدرت أن المواطن الهولندي العادي مندرج ق نحو 0٠١0 - ۲٥١‏ قاعدة بيانات» في حين 
أن المواطنين الأكثر نشاطا من الناحية الاجتماعية مندرجون فى نحو ٠٠٠١‏ قاعدة بيانات. 
ولا تشتمل قواعد البيانات هذه على الآثار الرقمية للمواطنين فحسب (البيانات التي 
يتركها المواطنون أنفسهم t‏ أعقابهم). ولكنها تتضمن أيضًا سانات الصور التخيلية Data)‏ 
75 الخاصة بالأفراد (البيانات عن المواطنين التي ينشئها 03,2( وهي توفر 
بشكل متزايد عملية تعقب البيانات الخاصة بالموقع والتفاعلات وا معاملات عبر المكان 
والزمان )2011 (Clarke 1994a; Lyon 2007; Dodge and Kitchin 2005; Koops‏ 
وعلاوة على ذلك» ففي حين أن الآثار الرقمية والصور التخيلية للبيانات سريعة الزوال ولا 
تدوم إلا فترة محدودة للغاية: فإن النسخة الرقمية منهما تدوم بشكل كبير للغاية ويمكن 
تخزينها في قواعد البيانات لفترة غير محدودة )2011 (Koops‏ مما يؤدي إلى إنشاء 
عام من الممكن له أن يتذكر جميع نقاط البيانات ولا ينسى على الإطلاق Dodge and)‏ 
.(Kitchin 2007‏ فهذه الآثار الرقمية والصور التخيلية للبيانات يتم تفتيتها وتقسيمها 
ونشرها عبر الكثير من المنظمات والخوادم» وهي تكون عرضة للدمج والتقسيم Raley)‏ 
2013(. وف أفضل الأحوال. تشكل الآثار الرقمية والصور التخيلية للبيانات القليل من 
اليرؤى -.رؤى فخدودة من blaj‏ مرتفعة جزئية من مواقف محددة مع إسقاط الرؤى 
المحددة )2002 (Amin and Thrift‏ - وذلك بدلا من تمحيص هذه الآثار والتخيلات 
سويا من أجل تكوين رؤية شاملة وعامة تحيط بكل شيء. وعلى الرغم من ذلك وإذا 
وضعنا في اعتبارنا ارتباطية البيانات وقيمة تضخيم «SUI‏ فإن الاتجاه السائد سيكون 
تجاه تجميع وجهات النظر المحدودة من أجل تكون تصور أكثر قوة. 

وإجمالاء توفر الآثار الرقمية والصور التخيلية للبيانات سجلا مفصلا بحياة ا مرء اليومية 
وأنماط استهلاكه» وعمله. وسفره. واتصالاته. ولعبه» وتفاعلاته مع المنظمات. وأفكاره 
واهتماماته. وليس الأفراد فحسب هم من يقعون تحت طائل هذه المراقبة الشاملةء ولكن 
هذه المراقىة تشمل أيضا الأشياء والمؤسسات والتعاملات وال مناطق Dodge and Kitchin)‏ 
25). وم يحدث أبدا في السابق أن يتم تكوين مثل هذه الكمية من البيانات عن حياة 
الناس الاقتصادية والاجتماعية بسهولة بالغة» وأن يتم إتاحة هذه البيانات على نطاق واسع 
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للغاية من خلال أسواق البيانات والبنى التحتية للبيانات وميادرات السانات المفتوحة. 
وف الواقع: فإن اكتساب الوصول إلى البيانات الحساسة ليس مقتصرا على الحكومات 
CDS ils‏ والنظمات: وذلك يسبب أن .مراقة التظراء أضبحت أمزا ST‏ انتغازا JS cio‏ 
نسبى دون معرفة أو دون الحصول على إذن الشخص الخاضع للمراقبة Andrejevic)‏ 
dbg (2007‏ كان هذا الأمر متاحا على الدوام من خلال التطفل والقيل والقالء ولكنه 
أصبح أكثر سهولة في الوقت الحالي من خلال الإنترنت سواء كان هذا من خلال البحث عن 
البيانات أو شراء تلك البيانات» أو من خلال استعراض سحلات الأجهزة الرقمية كالهواتف 
الخلويةء وبرامج تصفح الإنترنت» أو برامج الملاحة بالأقمار الصناعية في السيارات... وغير 
ذلك أو من خلال وضع أجهزة مراقة رخصة MERC‏ مثل الكاميرات الدقيقة المصغرة. وكما 
ناقشنا في الفصل الثاني» فإن سماسرة البيانات يسمحون بدراسة تواريخ الأشخاص وذلك 
فيما يتعلق ببعض المسائل مثل الحالة الاجتماعيةء والإفلاسء وملكية العقارات» والتاريخ 
الوظيفيء والسجلات الجنائية» والحالة الضريبية» ودعاوى العنف الجنسي أو العنف الأسري, 
والخلفية التعليمية... وغير ذلك. 

ومن ثم فإن طوفان البيانات مكشوف أمام مراقبة البيانات والاستغلالء فمراقبة 
البيانات» تعد أحد أساليب المراقبة التي يتم تفعيلها من خلال فرز وتدقيق مجموعات 
البيانات وذلك بغرض التحديد واطراقبة: والتتبع. والتنظيم» والتنبؤء والتوجيه 
(Clarke 1988: Raley 2013)‏ وتعمل مراقبة السانات على تحويل الكميات الهائلة 
من الأفعال والأفكار التي تمثلها هذه البيانات إلى صورة واضحة ومقروءة ونماذج 
واضحة للحكم على (Curryet al. 2004: 359) eL 2I‏ وهي مكون أساسي من 
الأشكال الحديثة للحوكمة والحاكمية. وفيما يتعلق باستخدام البيانات» وكما ناقشنا 
في الفصل السابع: يتم استخدام البيانات من أجل توصيف واستهداف الأشخاص 
وذلك بهدف زيادة الأرباح. ومن ثم ففي غالب olm VI‏ يتم إعادة تحديد الغرض 
من البيانات واستخدامها في أغراض م تكن مقصودة على الإطلاق عند تكوين هذه 
البيانات» ومن ثم فإن مراقبة OVI‏ الرقمية والصور التخيلية للبيانات يثيران العديد 
من المخاوف الإضافية وخاصة فيما يتعلق بقضايا مثل الخصوصية. والتنميط والفرز 
الاجتماعي: وإقرار أساليب متعددة للحوكمة. 
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: (Privacy) duo gas! 
حقا من حقوق‎ A53 الخصوصية هي حالة يتوقعها ويقدرها الكثير من الناس» وهي‎ 
الإنسان الأساسية» وهي من الحقوق المقدسة في الكثير من القوانين الوطنية والدولية.‎ 
وف الولايات المتحدة: فإن الخصوصية مغطاة بشكل كبير في القوانين المسماة قوانين‎ 
الخصوصية: أما في الاتحاد الأوروبيء فهي تقع ضمن نطاقات قوانين حماية البيانات‎ 
والخصوصية مصطلح متعدد الأبعاد فيما يتعلق بمعناه. وهو‎ .(Minelli et al. 2013) 
يستخدم في غالب الأحيان في طرق معتمدة على السياق. ولكن على وجه العموم هو‎ 
يشير إلى الممارسات المقبوله فيما يتعلق بالوصول إلى والإفصاح عن ا معلومات الشخصية‎ 
ومن الوسائل ال مستخدمة ق إيضاح‎ .(Elwood and Leszczynski 2011) والحساسة‎ 
الأبعاد المتعددة للخصوصية دراسة الوسائل العديدة التي يمكن من خلالها انتهاك‎ 
.)10.1 انظر الجدول رقم‎ Solove 2006) الخصوصية والأضرار المرتبطة بهذه الانتهاكات»‎ 
من خلال هذا التصنيف هو أن انتهاك الخصوصية يمكن أن يكون له‎ L فالذي يتضح‎ 
العديد من التأثيرات على الرفاهية الجسدية والعاطفية للأفراد: وتنجعل هؤلاء الأفراد‎ 
عرضة للأنشطة ال مضرة التي يقوم بها 09,2« ويجعلهم كذلك عرضة لاختلال توازن‎ 

السلطات غير المتمائل. 

ويوجد بعض الشكوك بأن مفهوم الخصوصية يتغير. وكما تمت الإشارة odei‏ فإن الناس 
عرضة الآن لمستويات من الفحص والتدقيق وكذلك أساليب المراقبة أكثر من أي وقت مضى. 
فا مهام التى كانت تعد في الماضي خاصة إلى حد كبيرء يتم OY‏ مراقبتها وتسجيلها. على 
سبيل JULI‏ فإن البرامج التي كان يشاهدها الشخص على التلفاز م تكن معروفة في ال ماضي 
إلا لمن هم حاضرون مع الشخص ذاته في الغرفة ذاتهاء في حين أنه يمكن لشركات التلفاز 
OYI‏ مراقبة ما الذي يتم مشاهدته على كل تلفاز على حدة وذلك بسبب استبدال البث 
التلفزيوني وحيد الاتجاه بالتواصل تنا الاتجاه. وما يشتريه المرء كان في السابق معروفا 
للعميل والشخص الذى يحدم هذا العميل فحسب والان أضحت هذه المعلومات التي يتم 
جمعها بشكل روتيني من خلال إدراج النقود الرقمية في عملية الدفع متاحة لشرائح أكبر. 
والأماكن التي كان يسافر إليها الفرد لم تكن سابقا معروفة إلى حد كبير لأي شخص ما عدا 
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المسافرين ومرافقيهم: ولكن في الوقت الراهن أضحى العديد من الأنظمة تكشف موقع 
الشخص والطرق التي اجتازها كنظم الملاحة باستخدام الأقمار الصناعية (GPS)‏ المثبتة 
في السيارات أو أجهزة الهواتف الخلوية: ونظام تثليث الإشارات ف أبراج شبكات الهاتف. 
وأنظمة النقل العام التي تعتمد على استخدام شريحة تحديد الهوية باستخدام موجات 
الراديو (RFID)‏ في أنظمة أو أكشاك دفع رسوم المرور. ومثل هذه البيانات التي تنتجها 
هذه الأنظمة يتم إعادة تجميعها ونشرها وبيعها. 


الجدول رقم )٠١ - ١(‏ 
تصنيف الخصوصية 


جمع ال معلومات Information‏ يقوم بها الشخص 
Collection‏ عواب. | الأشكال المتعددة من الاستجواب أو التقضي من أجل 


چ على امعلومات 


الإهمال à‏ حماية ا معلومات اممخزنة من التسريبات 
والوصول إليها بطريقة غير AE‏ 


الاستخدام الثانوي | يتم استخدام المعلومات التي تم تجميعها لغرض معين 
في أغراض أخرى دون الحصول على موافقة الشخص 
موضوع البيانات 

الإخفاق في السماح للشخص موضوع البيانات 
معرفة البيانات التي متلكها الآخرون axe‏ وا مشاركة 
في doleo‏ واستخدام هذه البيانات» وهذا يشمل 
الإقصاء وا منع من التمتع بالمقدرة على الوصول إلى 
هذه البيانات وتصحيح الأخطاء الواردة فيها. 















معالجة المعلومات 


Information Processing 





الاستبعاد 







YAV البيانات البيانات الكبيرةء والبيانات المفتوحة:ء والبنى التحتية للبيانات» والنتائج المترتبة عنها‎ 85s 





AZ 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل العاشر 


إخلاف الوعد في المحافظة على سرية بيانات 
٠ “J|‏ 


انتهاك السريه 


الكشف عن المعلومات عن شخص ما والتي تؤثر à‏ 


الإفصاح 
الطرق التي يحكم بها الاخرون على شخصيته 
الكشف عن عري أو حزن أو الوظائف الجسدية 
vex‏ : 

Aalsa‏ | 8305 إ[مكائنة الوصول إل امات 


الابتزاز التهديد بالكشف عن معلومات شخص ما 


خدمه أهداف a‏ مصالح شخص ات 


التشويه | نشر معلوماتا خاطئة أو us Ge dllas‏ ما 


نشر اطعلومات 


[Information 





Dissemination 


C. : | 
FPE OR 
LE C. : : 











التطفل الأعمال الانتهاكية التي تزعج هدوء أو انعزال شخص ما 
الانتهاك التدخل المتعلق | التدخل في قرارات. الشخص موض وع البيانات التي 
Invasion‏ بالقرارات تتعلق بشئونه الخاصهة. 





المصدر: تم تجميعه من )2006( .Solove‏ 

وعلاوة على ذلك فنحن نعيش ف عام أكثر انفتاحا وشفافية بكثير عما bazel‏ عليه سابقا. 
فالمعلومات التي كانت تعد خاصة في السابق يتم مشاركتها الآن بشكل أكثر حرية كالسير 
الذاتية من خلال موقع لينكد إن (LinkedIn)‏ والصور والفيديوهات العائلية من خلال 
مواقع (Flickr) Klè‏ وإنستجرام (Instagram)‏ ويوتيوب (YouTube)‏ والقصص الشخصية 
والعائلية من خلال موقع فيسبوك (Facebook)‏ والمدونات: والأفكار والمعتقدات الشخصية 
من خلال تويتر (Twitter)‏ وغرف الدردشة والتعليقات على الإنترنت. فما كان يتم مشاركته 
في السابق مع عدد لا يتجاوز أصابع اليد الواحدة من الأشخاص كأفراد العائلةء والأصدقاء 
المقربينء وأرباب العمل في المنزل أو المقهى المحلي أو مكتب للموارد البشرية يتم نشره الآن 
على المستوى العالمي مما يسمح لأي شخص مشاهدته وتعديله )2013 (Minelli et al.‏ 
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وعلى الرغم مما ذكر سابقاء لا يتصرف كل شخص بسهولة وبحرية فيما يتعلق ببياناته 
الشخصية» حتى ولو كان الشخص يتصرف على هذا النحوء فإنه لا يتوقع بالضرورة أن هذه 
البيانات سوف يتم انتقاؤهاء ومعالجتهاء وتجميعهاء وبيعها. وهم لا يتوقعون أيضا أن 
تطبيقات البرامج التي لا يوجد بها أي عنصر من polie‏ وسائل التواصل الاجتماعي» والتي 
يعتبرونها تطبيقات خاصة رها تقوم بتكوين ونقل البيانات إلى مطوري تلك التطبيقات» أو 
أن بعض الشركات رها تحاول أن تقوم بالهندسة العكسية لإستراتيجيات حماية الخصوصية 
Jis‏ إخفاء الهوية من أجل إنشاء ملفات شخصية Garga‏ ومع ذلك. فإن هذا الأمر 
يحدث بانتظام. على سبيل JUL‏ وجدت صحيفة وول ستريت جورنال Wall Street)‏ 
(Journal‏ في اختبار أجرى على 101 تطبيق للهواتف ASII‏ أن 56 là, las‏ نقلت معرف 
الجهاز المتفرد للهاتف إلى شركات أخرى وذلك دون معرفة المستخدم أو الحصول على 
موافقته» وأن 47 TAR‏ أرسلت موقع الهاتف» وأن 5 تطبيقات أرسلت البيانات الشخصية 
للمستخدمينء وأن 45 تطبيقا لم يكن بها أي ارتباط مع سياسات حماية الخصوصية التي 
ممكن للمستخدمين مشاهدتها )2011 .(Efrati et al.‏ كما وجدت شركة الثقة الإلكترونية 
(TRUSTe)‏ أن X14‏ كمك قن dob! a 1621032١ edel‏ الخصوصة is‏ متاجر 
شركتي أبل وجوجل يشترطان ضرورة اشتمال التطبيقات على هذه السياسة Coterill)‏ 
2011(. ومع ذلك وكما أشار )2011( Gralla et al‏ يمكن للتطبيقات أن تتتبع وتنقل 
"عاداتك على الشبكة. olg‏ تبحث في قائمة جهات الاتصال لديكء وأن تجري مكالمات 
هاتفية دون أن 3,53« وأن تتتبع موقعك» وأن تفحص ملفاتكء وغير ذلك الكثير". 

إن مشهد الخصوصية الآن في حالة تغير مستمرء وهو يخيب كلا من التوقعات القانونية 
والاجتماعية. وبالنسبة للبعضء O‏ مفهوم الخصوصية قد تعطل بشكل كبير Rambam)‏ 
Rubenking 2013‏ :2008). ويرى البعض أنه من الصعوبة ممكان المحافظة على الخصوصية 
في التطبيق العملي» كونها تحجب وتخفي تجربة ال لمستخدمء وهي معوق اقتصاديء ولا يبدو 
أن معظم الناس يعارضون أن يتم التنقيب في بياناتهم» وإذا لم يكن لديك شيء لتخفيهء فما 
المشكلة في أن يتم معرفة بياناتك؟ )2007 .(Raley 2013: 126; Solove‏ وبالنسبة للبعض 
الآخرء فإن الخصوصية حق يتعين حمايته لأنه من الحقوق التأسيسية ل "المواطنة المطلعة 
والمتأملة" وهو مكون أساسي Là‏ لحرية .(Cavoukian 2009) ueil‏ وعلى dis‏ يرى أن 
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الخصوصية "سمه ds jg pb‏ وتسس للأنظمة السياسية الدموقراطية المتحررة" Cohen)‏ 
2.232 فإذا تم إنكار الأشكال المتعددة من الخصوصية التي تم إيجازها في الجدول 
رقم »)٠١-١(‏ فإن الناس سيكونون عرضة لأنوع مختلفة من الأضرار الشخصية وأشكال 
الحوكمة الأكثر ضررا. ويبدو أن جميع المعلقين يؤيدون وجهة النظر القائلة ob‏ تشريعات 
الخصوصية لم تعد ملائمة للغرض التي شرعت من «del‏ وأنه يتعين تحديث تلك التشريعات 
لكي تلائم الأوقات التي نعيشها الآن. 
الجدول رقم )٠١ - Y)‏ 
مبادئ ال ممارسة العادلة للمعلومات 

الوصف 

الإخطار (Notice)‏ يتم إخطار الأفراد بأن بياناتهم يتم إنشاؤها ويتم إعلامهم بالغرض 
الذي سيتم استخدام هذه البيانات فيه 











الاختبار m4 (Choice)‏ الأفراد jul di yx‏ امشاركة أو Q93»9‏ عدم امشاركة وذلك 
فيما يتعلق I3] Le‏ كانوا يرغبون في استخدام بياناتهم أو الإفصاح 


عنها وكيفية القيام بذلك 


اموافقة (Consent)‏ يتم إنشاء البيانات والإفصاح عنها فحسب بعد موافقة الأفراد 
امعنيين 
الأمن (Security)‏ يتم حماية البيانات من الفقد» وإساءة الاستخدام» والوصول غير 


e ^al‏ بك والإفصاح dge‏ وتعديلها أو تدميرها. 


التكامل (Integrity)‏ تكون السانات موثوقة 42,859 وكاملة وحالية 


الوصول (Access)‏ يمكن للأفراد الوصول إلى بياناتهم الشخصية والتحقق منها والتثبت 
منها 


ا مساءلة (Accountability)‏ إيكون مقتني البيانات هنم كلا عن ضمان تحقق المبادئ السابق 
ذكرها وأن يكون لديه الوسائل اللازمة من أجل ضمان الالتزام بهذه 
SL.‏ 





















.(Minelli et al. (2013: 156 المصدر:‎ 
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)٠١ - Y) الجدول رقم‎ 


أنواع المعلومات ابلحمية 


المعلومات الشخصية ال معرفة | المعلومات الحساسة: هي أي | المعلومات الأخرى التي يمكن 
:(PIT)‏ هي أي معلومات تعرف 


ob‏ " > ماما چ ڪڪ dh d‏ المصرح لها أن يسبب الإحراج أو 
اقزر PETEN‏ 


TT 1ك‎ 


العنوان البريدي / الرمز البريدي الآراء السياسية digd‏ ملف تعريف الارشباط 
(cookie)‏ 


امعتقدات الدينية / الفلسفية | عنوان بروتوكول الإنترنت الثابت 
O [u| aag‏ 


رقم رخصة القيادة الحالة الاجتماعية / الحياة 


الجنسية 
رقم الحساب الال o] o com]. Gen‏ 


Ll ا‎ 


المصدر: مقتىس من 159 :2013( .(Minelli et al.‏ 
ds‏ الوقت الراهنء فإن تشريعات الخصوصية مبنية حول الحقوق الشخصية والموافقة 
المتعلقة بإنشاءء. واستخدام: والإفصاح عن البيانات الشخصية )2013 .(Solove‏ وهي تتكون 
من سبعه مبادئ dable‏ للخصوصيه )156 :2013( Minelli et al.‏ (انظر الجدول رقم )٠١ - Y‏ 
3s‏ إطار هذه المبادئء فإن الأفراد. من الناحية النظرية: يتم منحهم الحق للتحكم ف بياناتهم 
الشخصية ومنح موافقتهم للآخرين فيما يتعلق بهذه البيانات. وعلاوة على «eS‏ فإنه يتعين على 
مقتنيي البيانات الالتزام بقوانين حمايه البيانات التي تقيد الإفصاح عن ال معلومات الشخصية 
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المعرفة «(Personally Identifiable Information- PII)‏ وا معلومات الحساسه» والسانات 
الأخرى التى يمكن استخدامها للاستدلال على الشخصية (انظر الجدول رقم :»)3١-٠‏ وتؤيد تقليص 
السانات بحيث يقتصر إنشاء السانات على السانات الضرورية لتحقيق غرض معين Tene and)‏ 
.(Polonetsky 2012‏ وعلى وجه العموم: فإن Jal‏ لاشتراطات ال معلومات الشخصية ال معرفة 
(PII)‏ هو استخدام أساليب إخفاء الهوية مثل عدم تحديد الهوية (إخفاء المعلومات الشخصية 
المعرفة): والأسماء المستعارة: والتجميع» بالإضافة إلى التشفيرء والتخزين الآمن» والقيود الخاصة 
بالوصول إلى المعلومات )2011 (Coterill‏ 

وأخيراء تجدر الإشارة إلى وجود العديد من المشالل الإدراكية والبنيوية المرتبطة 
بتشريعات الخصوصية الحالية. 

وتحاول الدول بصورة روتينية التحايل على قوانين الخصوصية وذلك من أجل أغراض 
الأمن وجمع ال معلومات الاستخباراتية» بحسب ما تم الكشف عنه Es‏ بواسطة برامج 
تحليل وجمع البيانات السرية في الولايات المتحدة الأمريكية: وا مملكة المتحدة: والعديد من 
الحكومات الأخرى (انظر الفصل السابع). كما أن الكثير من الشركات لا تشعر بأنها مجبرة 
على تقديم سياسة الخصوصية للأفراد وذلك لأن هذه الشركات تدعي أنها تجمع معلومات 
مجهولة المصدر.ء ومن ثم فهي لا تقع تحت طائلة ممارسات المعلومات العادلة. أو رها 
تقدم هذه الشركات سياسة الخصوصية, وذلك عند الاستهلال الأولى للالتزامات (على سبيل 
المثال» عند تثبيت برنامج ما أو الاشتراك في خدمة ما) وتكون هذه السياسة مصاغة بلغة 
معقدة وغامضة: وعادة ما تشتمل على الاحتفاظ بالحق في تعديل هذه السياسة في وقت 
لاحق دون تشاور إضاق مع الشخص )2013 (Rubinstein‏ 

وفيما يتعلق بالبيانات التي تم تكوينها بدون معرفة «jas ÀJ]‏ فمن الصعوبة مكان 
اكتشاف dio‏ هذه الممارسات ومواجهتها من الناحية القانونية. أما في äl‏ الخصوصية 
ذات الإدارة الذاتية» وكما شرح )2013( Solove‏ فهي ببساطة مرهقة للغاية وبالغة 
الصعوبة على الأفراد كونها تتطلب قيامهم بتنظيم خصوصيتهم عبر الكثير من الكيانات» 
والموازنة بين التكاليف والمنافع المرتبطة بالموافقة على الشروط والبنود دون معرفة كيف 
سيتم استخدام هذه البيانات في الوقت الحالي وف المستقبلء وأيضا تقييم التأثيرات الشاملة 
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والتراكمية لبياناتهم التي سيتم دمجها مع مجموعات البيانات الأخرى. slog‏ على ذلك 
أشار )2013( Solove‏ إلى أن: 
)1( الناس لا يقرؤون سياسات الخصوصية؛ (2) إذا قرأ الناس سباسة الخصوصةء 
فإنهم لا يفهمونها؛ (3) إذا قرأ الناس سياسة الخصوصية وفهموهاء فإنهم في الغالب 
يفتقدون الخلفية الكافية لاتخاذ اختيار مبني على المعرفة؛ (4) وإذا قرأ الناس سياسة 
الخضوصية وفهموها. وكان بإمكانهم اتخاذ اختيار glo‏ ومبني على xl‏ 43« فإن 
اختيارهم ممكن أن ينحرف وذلك من جراء العديد من الصعوبات المرتبطة باتخاذ 
القرار )1888 :2013 .(Solove‏ 
ومن ثم فإن الموافقة تكون في غالب الأحيان ممارسة à £Ae‏ الجدوى Rubenstein)‏ 
2 :2013( وذلك عندما يقوم الأفراد عن غير قصد بالتخلى عن الحقوق دون إدراك لمدى أو 
عواقب الفعل الذي يقومون به. ومن ثم» فإن سياسات الخصوصية في غالب الأحيان تخدم 
إخلاء المسئولية للشركات بصورة SÍ‏ مما تخدم عملية ضمان الخصوصية للمستهلكينء 
.(Tens and Polonestky 2012)‏ وعلاوة على ذلك. فمن الواضح أنه في sae‏ البيانات 
الكبيرةء فإن إستراتيجية إزالة التعرف على الأشخاص توفر شكلا ضعيفا فحسب من أشكال 
الخصوصية لأن من الممكن القيام بالهندسة العكسية للعملية وذلك من خلال التنقيب في 
مجموعات السانات وتجميعها )2010 .(Narayanan and Shmatikov‏ فعلى سسل JUL‏ 
يشرح نيف سينحجر (Niv Singer)‏ من شركة تراكسك (Traxc)‏ (واممقتىس Minelli et à‏ 
åd (al. 2013: 31‏ إزالة التعرف على الأشخاص كما يلي: 
يمكن في بعض الأحيان أن يكون من الصعوبة بمكان توحيد الملفات الشخصية 
الاجتماعيه المستخدم واحد والذي رها يستخدم العديد من الأسماء أو تعاملات 
مختلفة في كل واحدة من شبكات التواصل الاجتماعي. ولذا فلقد قمنا ببناء 
خوارزميات تقوم بالتنقيب ف العوامل الأساسية التي تشتمل على محتوى 
ا لمشاركات والموقع على سبيل JELI‏ لا الحصرء وذلك من أجل توفير توحيد للهوية 
بشكل فعال إلى درجة كبيرة. 
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ونتيجة لهذه ا مخاوفء يدرس الاتحاد الأوروبي منذ فترة سياسات حماية البيانات (انظر 
المفوضية الأوروسة ;2011 European Commission 2012. Hon et al. 2011; Koops‏ 
(Rubinstein 2013‏ وتشتمل اقتراحات الاتحاد الأوروبي على ol‏ تكون الموافقة dox) po‏ 
ولىست doad‏ أو مفترضة؛ وأن يكون وصول الأفراد إلى البيانات الخاصة بهم i‏ وشاملا 
وآن يكون للأفراد الحق ف قابلية النقل للبيانات بمعنى المقدرة على نقل البيانات الشخصية 
من مزود خدمة إلى مزود آخرء والحق في أن يتم نسيان الشخصء حيث يمكن للأفراد أن 
يطلبوا حذف بياناتهم إذا م تكن هناك أي أسس مشروعة للاحتفاظ بهذه البيانات» وأن 
تنطبق هذه القواعد أيضا على الشركات خارج الاتحاد الأوروبي إذا كانت هذه الشركات عاملة 
في سوق الاتحاد ELSEN‏ وتقدم خدماتها مواطني دول الاتحاد European 2012) ELSEN‏ 
(Commission‏ وباطمشل» تقدمت مفوضية التجارة الفيدراليه في الولايات المتحدة 
الأمريكية باقتراح o ds‏ ثلاثة تعديلات من أجل توفير bles‏ أكثر فعالية للخصوصية: 
الخصوصية من خلال التصميم حيث يتم تأسيس الخصوصية بشكل متأصل في كل مرحلة 
من مراحل تطوير المنتج؛ منح الشركات والمستهلكين خيار مبسط agong‏ المقدرة على 
اتخاذ القرارات بشأن بياناتهم الخاصة: liag‏ يشمل تطبيق آلية eas‏ التتبع والحصول على 
الموافقة الصريحة فيما يتعلق بالبيانات الحساسة: أو الحصول على موافقة قبل استخدام 
البيانات في غرض مختلف بشكل مادي عن الغرض الذي تم من أجله تكوين هذه البيانات؛ 
وشفافية أكثر فيما يتعلق بالبيانات وجمعها واستخدامهاء وهذا Jais‏ الوصول Jos‏ 
إلى البيانات من قبل هؤلاء الذين تمثلهم تلك البيانات» مع منحهم المقدرة على تصحيح 
أو حذف السانات (مفوضة التجارة الفيدرالية 2012 (Federal Trade Commission‏ 
وتنشد إستراتيجية الخصوصية من خلال التصميم تطبيق إستراتيجية مختلفة عن الالتزام 
التشريعي والتنظيمي» وهي تقترح أن تكون الخصوصية هي الوضع الافتراضي للعملية؛ 
أي نظام يسعى dlei‏ وبوضوح الى ضمان الخصوصية )2009 .(Cavoukian‏ ومن OUS‏ 
المبادئ السبعة المذكورة في الجدول رقم )€ - )٠١‏ أن تعزز هذا المنهج. 
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الجدول رقم )€ - )٠١‏ 
المبادئ السبعة الأساسية للخصوصية من خلال التصميم 
jabl‏ الوصف 
استباقية وليست تفاعلية؛ | ينبغي أن تسعى نظم تكنولوجيا المعلومات لتوقع الخصوصية 
تحديد المخاوف المتعلقة بالخصوصية وتجنبها بدلا من السعي 
إلى حل المشاكل الناتجة عن مخالفات الخصوصية بعد حدوثها 


الخصوصية هي الوضع الافتراضي | الخصوصية محمية تلقائيا ولا تتطلب أي عمل من جانب الأفراد 


الخصوصية مدمحة à‏ التصميم حماية الخصوصة هي سمه أشساسية للتصميم والهندسة AS al‏ 
لأنظمة تقنية المعلومات وليست ميزة إضافية متدنية الأهمية 


الفعالية الكاملة - عائد loo!‏ | جميع المصالح والأهداف المشروعة يتم استيعابهاء بدلا من أن 
وليس محصلة صفرية يكون هناك مقايضات بين الخصوصية واعتبارات أخرى مثل الأمن 
الأمن من النهاية للنهاية-حماية | تكون الخصوصية جزءًا لا loco‏ من ell‏ من بداية إطلاقه إلى 
كاملة طوال دورة حياة النظام | حين التخلص منه 

الوضوح والشفافية - فلتكن | تكون جميع الأجزاء المكونة للنظام وعملياته واضحة وشفافة 
مفتوحة على الدوام للمستخدمين والشركات ال موفرة على السواء وتخضع لتدقيق مستقل 
احترام خصوصية ال مستخدم - أي يجب أن يبنى النظام حول l YI‏ وأن يحمي مصالحهم» وآن 










الوقاية وليس العلاج 































جعلها تتمحور حول اممستخدم | يكون مكنا لهم 
المصدر: )2009 „(Cavoukian‏ 


لقد اقترح العديد من العلماء المتخصصين في الخصوصية وأيضا العديد من مجموعات 
الضغط الصناعية مناهج متعددة LASI‏ التعامل مع قضية الخصوصية: فالعلماء 
المختصون بموضوع الخصوصية سبق لهم التطرق للمواضع التالية: الإصلاح التشريعي 
المصمم من أجل حماية حقوق المواطنين: والذي يشمل بعض القضايا كالحق في الصفحة 
البيضاء وتواريخ الانتهاء (Koops 2011) SLL‏ ومن الذي يكون مسئولا عن ضمان 
الخصوصية: المطورون el‏ الوكالات el‏ المستخدمونء وعن الوسائل التقنية والإدارية 
لتنفيذ هذه الأمور )2011 .(Coterill‏ وما الذي يشكلا ال معلومات الخاصة وكيفية تأطير 
الخصوصية حول المخاطر ومدى الضرر بدلا من تأطيرها حول تعريف المحتوى Hen)‏ 
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(etal. 1‏ واقترح هؤلاء العلماء أيضا دخول الأفراد في شراكات مع المطورين حيث 
يكون بإمكانهم أن يختاروا بشكل أكثر استباقية ما البيانات التي يرغبون في نشرهاء 
ومن تنشر هذه البيانات» وتحت أي ظروف تنشر هذه البيانات. كما اقترحوا أن تتيح 
الشركات للمستخدمين الوصول إلى بياناتهم الشخصية بصيغة قابلة للاستخدام وذلك من 
أجل مصلحتهم الشخصية. وأخيراء اقترحوا أن تقوم الشركات بمشاركة الثروات الناتجة 
عن تحويل السانات الشخصية إلى أموال Tene and Polonetsky 2012; Rubinstein)‏ 
73). وكمثال على هذه المشاركة المفيدة لكلا الطرفين في الثروات المتحصلة من بيع 
بيانات الشبكات الذكية حيث يتم استخدام البيانات التي تم تكوينها من خلال العدادات 
الذكية والمتعلقة باستهلاك أفراد الأسرة للكهرباء من قبل شركة الكهرباء من أجل ضمان 
كفاءة التزويد بالكهرباء» ويتم مع ذلك توفير تطبيقات لأفراد الأسرة لتمكينهم من مراقبة 
استخدامهم الشخصي وأن يعدلوا سلوكياتهم من أجل توفير المال. إن سوق الصناعة» إلى حد 
كبير» يريد إما الاستمرار في الإمدادات الحالية على ما هي عليه 9l‏ تقليل هذه الإمدادات» 
مع إدارة الخصوصية من خلال تنظيم يقود السوق ولا يكبح الاستفادة الاقتصادية من 
البيانات. وف هذه الحالة» فمن المتصور أن الشركات سوف تقوم بعملية التنظيم الذاق 
خشية حدوث أضرار بسمعة تلك الشركات أو أن يعبر عملاء الشركات عن عدم رضاهم من 
خلال عدم التعامل مع هذه الشركات إذا انتهكت هذه الشركات خصوصية هؤلاء العملاء 
بشكل مبالغ فيه )2013 „(Minelli et al. 2013; Mayer-Schonberger and Cukier‏ 


أمن البيانات :(Data Security)‏ 
مع وضع قيمة البيانات في الاعتبار. وخاصة البيانات الشخصية التي يمكنها أن تسهل 
سرقة الهوية» أو البيانات التجارية التي يمكن قرصنتها أو استخدامها من أجل تحقيق ميزة 
تنافسية: أصبح أمن البيانات مجالا هاما في حماية البيانات. فالأفراد يمكنهم فتح العديد 
من الحسابات سواءً الحسابات الشخصية أو حسابات العملء مع العديد من الهيئات 
والبائعين وذلك باستخدام العديد من رموز الهوية الشخصية وأسماء المستخدمين وكلمات 
السر. فالبيانات المتعلقة بهؤلاء الأفراد. والبيانات الشخصية الخاصة بهم» يتم تخزينها في 
الكثير من الأماكن (على سبيل JULI‏ أجهزة الحاسب الآلي. والأجهزة الرقمية: والهواتف 
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USB) وأجهزة تخزين السانات امتنقله مثل‎ TNT ومحركات الأقراص الصلئة‎ ASII 
والخوادم. وتكون هذه الحسابات والآجهزة الرقمية عرضة للقرصنة (الدخول على‎ (Drive 
والبرمجيات الخبيثة (الرموز التي يتم تثبيتها بشكل‎ (8582 I الحسابات أو الوصول إلى‎ 
سري على جهاز الحاسب والتي يمكنها الوصول إلى المعلومات الحساسة أو تسجيل ضغطات‎ 
(الرسائل‎ (Phishing) والانتحال‎ (ÈJ لوحة ال مفاتيح وترسل هذه الأشياء إلى طرف‎ 
الإلكترونية الاحتيالية أو الهندسة الاجتماعية من خلال ال مكالمات الهاتفية التي تحاول أن‎ 

تحعل الشخص بتطو P‏ بتقديم معلومات (duo‏ مما يودي الى سرقه واختلاس السانات. 
وقد ناقش 2011( (Gantz and Reinsel‏ بالتفصل خمسة مستودات لأمن السانات: 

وكل مستوى من هذه المستويات له محركات مختلفة الى حد ماء وذلك على الرغم من أن 

جميع هذه المستويات تتطلب إجراءات أمن استباقية. وهذه المستويات تكون على النحو 

التالي: 

(Y)‏ الخصوصية: من أجل المحافظة على المعلومات وتقسيد تداولها. 

(Y)‏ الامتثال والالتزام: من أجل حماية البيانات التي من المختمل أن تكون قابلة للكشف 
عند التقاضيء أو الخاضعة لشروط الاستبقاء. 

(Y)‏ الاحتراز: من أجل حماية البيانات التي يمكنها أن تؤدي إلى أو تساعد على سرقة الهوية. 

)€( السرية: من أجل التأكد من حماية المعلومات السرية مثل الأسرار التجارية. 

«y Ll (0)‏ من أجل حماية المعلومات عالية السرية مثل الصفقات التجارية: وا ملفات 
الشخصية. والسجلات الطبية» وا لمعلومات العسكرية» التي يمكن أن يكون لها تأثير 
يتجاوز السرقه الشخصية. 
وتعد إدارة امستويات الخمسة السابقة لأمن السانات مُهمة بالغة الأهمية بالنسبة للأفراد 

والشركات وامؤسسات. وعلى 9 ác‏ العموم: يتم انجاز هده ا مهمه من خلال التحكم à‏ الوصول 

عبر برامج الأمن وتصميم النظام / الشبكات (على سبيل المثال تثبيت جدار ناريء وبرامج 
الخبيثة). والتشفير الذي يتطلب كلمة سر لفتح الملفات المغلقة. وإذا وضعنا في الاعتبار أنه 
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بمجرد أن يتم الوصول إلى البيانات فسوف يصبح من السهل نسخها ونشرهاء فإن إدارة الحقوق 
الرقمية تسعى لتقييد مثل هذه الممارسات وأن تجعل من السهل أيضا تتبع تلك الممارسات. 

ومع «US‏ وعلى الرغم من هذه التهديدات» فإن الأجهزة الرقمية والخدمات والبيانات: 
ونقاط الضعف ال محتملة في تهيئتهم: تزيد سرعة أكر من اللقدرة على تأمينهم Gantz)‏ 
.(and Reinsel 2011‏ وى حين أن الكثير من أجهزة الحاسب الشخصية وأجهزة الحاسسب 
المحمولة آمنة بصورة نسبية مادامت برامج الحماية الخاصة بها تحدّث بشكل 48393 
إلا أن أجهزة الحاسب اللوحية: والهواتف المحمولة. وأجهزة الفاكسء ومحركات الأقراص 
الصلبة الخارجية» والأجهزة الطرفية (مثل الطابعات» وأجهزة المسح الضون» وآلات تصوير 
المستندات الشبكة)ء والعدد الهائل من الأجهزة التي تشكل إنترنت الأشياء عادة ما تتمتع 
بحماية قلبلة )2013 .(Rezendes and Stephenson 2013; Rose‏ وقد sol‏ ذلك ب 
(Mims (2013‏ إلى الادعاء بأنه مجرد وجود أي شيء في بيئة تشتمل على رمز رقمي ويتم 
توصيله بالشبكة. فيمكن قرصنة هذا الشيء من خلال كائنات يُحتمل أن يتم التحكم بها 
عن بعدء أو يتم إجبار ذلك الشيء على تجاوز معايير التصميم» أو العمل بطرق غير مريحة 
أو خطرةء أو يضلل المستخدمين مما يؤدي إلى حدوث الأخطاء والأضرارء أو يتجسس على 
الساكنين أو المستخدمن. وعلاوة على ذلك» فان الطرق المستخدمة من قبل القراصنة أو 
T Cao uel adiac‏ 3 ققق دا وكدوانية عن olg adl‏ ضناعة al‏ دوما Gl à‏ من 
أجل مواكبة هؤلاء القراصنة وال لحتالين )2012 (Goldberg‏ 

فمع تطور ثورة البيانات» ووفرة ا مزيد من الأجهزة التي تنتج, وتتبادل وتستخدم 
«LU UI‏ يبدو أن القضايا وال مخاوف الأمنية معرضة للازدياد وليس التقلص Gantz et al.)‏ 
liag .)27‏ بدوره سيؤدي إلى تفاقم الجرائم مثل سرقة الهويةء وتقوض الثقة في نظم 
البيانات» ورفع سلسلة من المسائل القانونية المتعلقة بالمسؤولية والالتزامات تجاه حماية 
النظم عندما يتم العبث بالبيانات» واختلاسها وسرقتها )2010 (Weber‏ 
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Profiling, Social) التشخيص. والتصنيف الاجتماعي والخطوط الحمراء‎ 
: (Sorting and Redlining 

بعيدا عن توسيع محيط المراقبةء وانتهاك الخصوصية» ونقاط الضعف المتعلقة بأمن 
البيانات» ab‏ المخاوف بشأن ماهية المجالات التي يتم فيها توظيف فيضان البيانات لتحقيق 
أشياء معينة. وكما أشرنا إلى ذلك ف الفصل السابعء مم تتغير طبيعة البيانات فحسبء ولكن 
يوجد أيضا تحول نوعي في الكيفية التي يتم بها تحليل البيانات» وفي أي الغايات يمكن 
استخدام البيانات وتحليلات البيانات» ومن لديه السلطة لاستخدام واستخلاص القيمة من 
البيانات. فالبيانات كانت تستخدم لوقت طويل من أجل تنميط وتقسيم وإدارة السكانء 
ولكن هذه العمليات أصحت à‏ الوقت الراهن أكثر 055 4853« وانتشاراء وانتظاما 
عن ذي قبل بكثير. وفي حين أن الهيئات الحكومية تكون ملفات شخصية للأفراد وذلك 
من أجل أغراض الأمن ورصد الاحتيالء إلا أن معظم النمو في عملية التنميط يتم من قبل 
الشركات التجارية والتى تسعى إلى فهم واستهداف قاعدة المستهلكين الحالية والمحتملة 
(انظر الفصل الثاني). 

ففي الماضيء. كانت الشركات تقوم بالتسويق الجماعي» ونشر رسالة dole‏ إلى حد ما 
وسط مجموعة كبيرة جدا من الجمهور وذلك من خلال الإعلان الجماعي باستخدام JALI‏ 
والراديوء والطباعة: والبريد الإلكترونيء وذلك من أجل الوضول إلى المجموعة المستهدفة 
لتلك الشركات )2011 .(Schwartz and Solove‏ وممرور الوقت. تم تعزيز هذا الأمر 
من خلال التسويق المستهدف وذلك باستخدام التنميط الخام بشكل نسبي. وهناء قامت 
مجموعة صغيرة من الشركات ال متخصصة بتكوين تصنيفات dole‏ للسكان حيث تم تصنيف 
الأسر إلى أصناف ذات ملفات شخصية dole‏ والتي كانت في العادة يتم تسميتها من خلال 
اختيار متغيرات ومواقع دبموغرافية. على سبيل المثال باستخدام بيانات الإحصاء Als JI‏ 
3l‏ البيانات التي تعكس أسلوب الحباة كاستخدام بيانات الاشتراكات في دوريات dusza‏ 
على سبيل Juss (Goss 1995) JUXI‏ من محاولة تنميط عملائهم الشخصيينء. ترغب 
الشركات في شراء الملفات الشخصية وبيانات الاتصال وذلك من أجل تقسيم واستهداف 
أصناف معينة من السكان من خلال رسالة مؤطرة بدقةء وف الوقت نفسه تحقيق الفعالية 
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في ميزانية التسويق من خلال تقليل مصروفات الإعلانات المبددة. وف الآونة الأخيرة 
بدأت شركات التنميط في إنشاء ملفات شخصية فردية بدلا من الملفات الشخصية العامة 
وذلك من خلال تجميع البيانات من مصادر عدة مثل معاملات البطاقات الائتمانية 
ومعاملات بطاقات c EL‏ ومسارات النقرء والمشاركات في وسائل التواصل الاجتماعي: 
والعديد من أنواع البيانات الشخصية الأخرى )2013 (Siegel‏ وعلاوة على CUS‏ تستفيد 
الشركات ذاتها من الكميات الهائلة من البيانات التي تنشئها عن العملاء على سبيل JELI‏ 
من خلال المبيعات ومسارات النقر وإدارة علاقات العملاءء وتجميع هذه البيانات مع 
المصادر الأخرى للبيانات وذلك من أجل تكوين الملفات الشخصية الخاصة بهم والاشتراك 
في التسويق السلوقى. 

هنا من الناحية الظاهرية: يبدو أن التنميط التنبئى موقف مربح للجميع: للعملاء 
والبائعين» فالعملاء يحصلون على معاملة شخصية daang‏ في حين Lam‏ البائعون على 
مبيعات أكثر ويقللون من النفقات. ولكن وف LEL‏ فإنه Sce‏ استخدام التنميط التنبئي 
من أجل تصنيف الناس من الناحية الاجتماعية واستبعاد فئات منهم من خلال اختيار 
أصناف معينة منهم للحصول على وضع تفضيلي وتهميش واستبعاد الآخرين Graham)‏ 
Leyshon and Thrift 9‏ ; 2005). فعلى سبيل JULI‏ مكن للشركة تنميط الناس فيما 
يتعلق بمخاطرهم الائتمانية وما هى احتماليه مقدرتهم على الوفاء بسداد مدفوعاتهم 9l‏ 
فيما يتعلق بقيمة حياتهم المتوقعة إذا ما ظلوا في برنامج الولاء وما هي احتمالية تغييرهم 
لعاداتهم )2013 .(Minelli et al.‏ ومن خلال استخدام مثل هذه اطلفات الشخصيه 
da asl‏ مكن للشركات تحديد الأولويات لاهتماماتهم ومواردهم» وذلك يتم öle‏ من 
خلال التركيز على العملاء ذوي القيمة العالية. ومن ثم يتم قياس وتصنيف العملاء بشكل 
منتظم ويحصلون على خدمات تفضيليةء وبعضها يكون تمييزيا مثل استبعاد السكان الذين 
يدون بلا فائدة (لن يحققوا مكاسب للشركة): أو لن يحققوا مكاسب كافية: أو أن المخاطر 
امرتبطة بهم äle‏ مما مكن أن يؤثر بدوره على الفرص الحياتية Curry 1997; Danna)‏ 
odas .(and Gandy 2002; Wyly in press‏ الملفات i duara)‏ منتجات ومكن 
بيعها لشركات أخرى تكون مهتمة في تقييم قيمة ومخاطر العملاء المحتملين» ومن ثم فإن 
النتائج السلبية يمكنها أن تطال الشخص عبر الأماكن وعبر الأزمنة. 
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ومثل هذه الممارسات التمييزية يمكن أن تشتمل على تسعير فعال وشخصيء فمن الأمور 
الشائعة بالفعل في سلاسل المتاجر أن تكون السلعة ذاتها مسعرة بطرق مختلفة عر المتاجر 
المغتلقة وذلك (I lax ud‏ خصائضن وسهاتث الان الذؤن تسوقون هن o Ell oda‏ أو 
أن يكون Ob pew‏ مختلفا 395( الكمية المشتراة Wia)‏ امنتج الواحد بدولار o à‏ أن 
الثلاثة منتجات بدولارين): أو أن تختلف الأسعار باختلاف الجماعات W)‏ حصول الطلاب 
sl‏ امواطنين الكبار ق السن على تخفيضات) )1996 .(Varian‏ وتتمثل رغبة x‏ من 
الشركات ف تذاول مثل oda‏ اللمارسات على أسسن 455,5( ومعدلة لي تناسب الملفات 
الشخصية. وذلك حتى يدفع أناس مختلفون أسعار مختلفة للمنتج ذاته LS)‏ هي الحال 
مع أسعار تذاكر الطيران ولكن ilo‏ على نموذج مخصص). وتراوح الأسعار أيضا بشكل فعال 
ووفق السياقء slo‏ على الظروف. وقد بدا بالفعل تطبيق مثل هذه ال ممارسات الشخصية 
وا مرنة: Le‏ في ذلك قطاع المتاجر. فعلى سبيل «JULI‏ تطرق )2012( Clifford‏ إلى أمثلة تبين 
أن المتسوقين يدفعون ف المتجر ذاته أسعار مختلفة للمنتج ذاته وذلك استنادا إلى ملف 
العميل الشخصي. وف بعض الحالات» تقوم المتاجر بتعديل الأسعار وقت تسوق العملاء 
وذلك بناء على موقعهم داخل المتجر وتاريخ التسوق لهؤلاء العملاء حيث يتم منح القسائم 
الإلكترونية في ال موقع عندما agi‏ المتسوقون مسح امنتج باستخدام التطبيقات في هواتفهم 
الخلوية. إن الهدف من وراء التسعير الشخصي والفعال هو الحصول على كامل فائض 
القيمة المتاح في المعاملة وذلك من خلال تسعير البضائع والخدمات لأقرب سعر ممكن 
من السعر الاحتياطي (سعر التحفظ) لدى الفرد )17 :2012 (Tene and Polonetsky‏ 
وبعبارة 5,21« فإن هذا مصمم للاستفادة من (JULI SYI‏ لمصلحة المتجر. 

وبالنظر إلى قدرتهم على تشكيل وتصنيف خبرات ال مستهلكين والفرص الحياتية. OB‏ 
الملفات الشخصية للأفراد والبيانات وممارسات البيانات التى تدعمها بحاجة إلى اهتمام أكبر. 
وف الوقت الحالي» فإن كلا من البيانات المستخدمة والتحليلات المطبقة مبهمة وغامضة 
بالنسبة للمستهلكين وا مواطنينء فإذا انتهى الأمر بالشخص مدرجا على قائمة الممنوعين: أو 
تم معاملته بشكل سلبيء أو تم استبعاده من منتج ما من قبل شركة clo‏ على سبيل JULI‏ تم 
وضعه فى القانئمة السوداء للحصول على الائتمان» فمن الصعوبة بمكان تحديد الأسس لهذا 
التمييز ومجابهة هذه الأسباب. فالنقاد يدعون Lb‏ قد ولجنا عصرا حيث: 
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رما يتراءى للبعض أن لبنية البيانات أو الصورة التخيلية للبيانات ميزة وجودية» ولكنها 
Colo Jm‏ مبزة وحودنة. إن ما تقؤلة dii‏ اناك كتك AS]‏ حقيقة وصدقا مما تقوله 
أنت عن نفسك. فبنية البيانات هي البنية التى تم الحكم عليك من خلالها في ا مجتمع: 
وهي البنية التي AE‏ وتفرض وضعك ف العام فما نشاهده عند هذه الفترة من الزمن هو 
ale‏ التمشل على الكبنونة )1995 (Critical Art Ensemble‏ 

وعلى es JI‏ من ذلك فنحن نعرف أن البيانات الكبيرة وبنية البيانات فوضويان - فهما 
ممتلئان بالثغرات» والمتناقضات والأخطاء (انظر الفصل التاسع) - ونعرف أيضا أن البرامج 
والخوارزميات تعمل بطرق انتقائيه ومتحيزة )2011 (Kitchin and Dodge‏ ومن 99« 
فإن الأنظمة التي تعتمد على البيانات الكبيرة. والتي لا تعد شفافة وتفتقد إلى التدقيق 
اللازم وحق الرجوع الملائم» تطرح جميع الأنواع المحتملة من المشاكل وذلك عندما يمنحون 
الأفضليظة/لبنية البيانات: في الواقع. فإن الوقت Ule eol‏ الآن أكثر,من/أق.وقت مضى 
للرقابه القانونية والتنظيمية على التنميط التنبئي» وعلى الإجراءات التي تشوش على التمييز 
الوجودي للبيانات وتحمي do ya CRUCE‏ “رجه 


Secondary Uses,) الاستخدامات الثانوية والتحكم في الانسلال والحوكمة الاستباقية‎ 
(Control Creep and Anticipatory Governance 

ان أحد الأسس التي تستند إليها سياسة الخصوصية وحماية البيانات في الاتحاد TOL‏ 
وأمريكا الشمالية هو مفهوم تقليص البيانات. وهذا المفهوم يشترط أن تقوم الهيئات 
والبائعون بإيجاد البيانات الضرورية فحسب لأداء مهمة ماء بمعنى أن يتم الاحتفاظ 
نالنبانات Ub‏ كان ذلك ضروريا لأداء هذة المهمة أو كما alë‏ الاعتبارات القانونية؛ وأن 
البيانات التي يتم تكوينها يتعين استخدامها فحسب من أجل هذه المهمة Tene and)‏ 
.(Polonetsky 2012‏ ومعنى آخر لا يتعين على جامعي السانات أن يستولوا على أي شيء 
يمكنهم الاستيلاء عليه ولا يتعين عليهم WIS‏ تخزين هذه البيانات لمدة غير محدودة أو 
أن يتيحوا هذه البيانات لاستخدامات ثانوية. ومن الواضح أن هذه التطلعات والطموحات 
تتعارض مع المبادئ والأسس المنطقية للبيانات الكبيرة وعمل أسواق البيانات التي تسعى إلى 
تكديس البيانات في حال كان من الممكن أن تكتسب هذه البيانات أي قيمة ف ا لمستقبل: 
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.(Tene and Polonetsky 2012; Andrejevic 2013)‏ فالحل alol‏ البائعين تمثل في إعادة 
تقديم البيانات من خلال إزالة الأجزاء التي تشر لهوية الأفراد من هذه البيانات أو إنشاء 
بيانات مشتقة» مع إخضاع مجموعة البيانات الأساسية فقط لعملية تقليص البيانات. ويمكن 
في هذه الحالة بيع البيانات المعاد تقدهها أو استخدامها بعدة طرقء ومثل هذا الأسلوب 
لإعادة تحديد الغرض من البيانات أمر شائع» حيث يجادل البائعون أنه لا توجد حاجة 
ELY‏ الشخص الذي تشر إليه البيانات أو الحصول على موافقته» حيث إن هذه البيانات 
مجهولة ا مصدرء ومشتقة ومجمعة )2007 .(Solove‏ وهذا الحصاد ال محتمل للكميات 
الهائلة من البيانات» والذي تم الحصول على معظمه دون معرفة أو فهم الأشخاصء والذي 
يتم استخدامه بعد ذلك في استخدامات ثانوية» يثير الكثير من الأسئلة الأخلاقية التي لا 
تتعلق بالخصوصية وحماية البيانات فحسب» بل تتعلق كذلك بالحوكمة» ومن الأمثلة 
الواضحة والمتعلقة بالحوكمة هو التحكم ف الانسلال. 

إن التحكم في الانسلال يحدث عندما تكون البيانات التي تم إنشاؤها لشكل من أشكال 
الحوكمة مشتابه لشكل آخر )2001 (Innes‏ وحدث هذا غالبا بشكل شديد الوضوح فيما 
يتعلق بالأمن وخصوصا بعد أحداث الحادي عشر من سبتمبر. حيث تم إعادة توظيف 
البيانات الخاصة بخطوط الطيران والبيانات الإدارية الحكومية من أجل تنميط وتقييم 
مخاطر الأمن للركاب Jes (Lyon 2003b)‏ نحو مشابه» فلقد تم إعادة توظيف كاميرات 
الإشارات المرورية ورسوم الازدحام في لندن من أجل القيام مهام تتعلق بالأمن: وذلك بدلا 
من öl o‏ الانتهاكات المرورية فحسب .(Dodge and Kitchin 2007a)‏ ومن الأمثلة 
التجارية على التحكم ف الانسلال هو نظام الملاحة في السيارات المستأجرة حيث يتم إعادة 
توظيف هذا النظام من مساعدة السائقين على إيجاد طريقهم فحسب إلى مراقبه وفرض 
غرامة على هؤلاء الذين يقودون خارج المسار أو يخرجون من الولاية )2004 (Elliott‏ 
فالتحكم في الانسلال يقوض بشكل منهجي الأسباب المنطقية وراء تقليص البيانات» في حين 
أن نشره يشكل تهديدات واضحة للحريات الممدنية» حيث يكون جميع المواطنينء سواء 
الأبرياء أو المذنبين. خاضعن مراقبته وإجراءاته التأديبية. 
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وهناك مثال آخر على الاستخدام الثانوي للبيانات والذي ينتهك الحريات المدنية آلا 
وهو الحوكمة الاستباقية (التوقعية). وهناء يتم استخدام التحليلات التنبئية من أجل 
تقييم السلوكيات أو الأحداث المستقبلية المحتملة والتوجيه باتخاذ الإجراء المناسب. فمثل 
هده الجوكدة 21 ae as 3L‏ ھی aod JA dlc o‏ خلال 52:546 'الستوات. 
حيث يتم تنميط المسافرين من أجل المخاطر والتحقق الأمني وذلك قبل «JI‏ في الرحلة 
bbg .(Dodge and Kitchin 2004)‏ تستخدم العديد من قوات الشرطة ف الولايات 
المتحدة الأمريكية التحليلات التنبئية من أجل توقع موقع الجرائم المستقبلية أو من أجل 
توجيه ضباط الشرطة لزيادة دورياتهم في هذه ال مناطق )2013 1ءعء51). وعلى النحو 33« 
تستخدم بعض الشركات مثل هيوليت باكارد (Hewlett Packard)‏ التحليلات التنبئيه من 
أجل تقييم ومعرفة مَنْ من الموظفين من المحتمل أن يغادر الشركة ومن ثم التدخل بشكل 
استباقي فين Je‏ تقليل نفقات استبدال الموظفين )2013 (Siegel‏ وق مثل هذه الحالات» 
فإن آثار البيانات الخاصة بالشخص تقوم Le‏ هو أكثر من تتبع الأشخاصء إذ تقوم باستباق 
هؤلاء الأشخاص )2002 (Stalder‏ 

إن مثل هذه الأساليب من الحوكمة تفرض قضايا أخلاقية بسبب أنها توجه الاهتمام 
إلى مجموعات وأماكن معينةء وهي كذلك تسعى لراقبة السلوكيات التي رها لن تحدث 
على الإطلاق: وخلال هذه العمليةء كما تقوم بإعادة تشكيل كيف يكن للناس العمل من 
خلال الانضباط الذاق )2006 (Harcourt‏ . وعلاوة على ذلك: OLS‏ مثل هذه التحليلات 
التنبئية تعمل في غالب الأحيان على تفاقم التحامل والتمييز» وتعمل كذلك على تأسيس 
النبوءات ال محققه لذاتها (التوجه نحو إشباع الذات) )2013 (Harcourt 2006; Siegel‏ 
ومن ثم فلقد ادعى 128 :2013( :(Raley‏ "إن البيانات في هذا المجال تكون آدائرة: فتجميع 
أجزاء وبتات (bits)‏ من البيانات في ملفات شخصية لمشتبه به ف الإرهاب» وإعادة تأسيس 
البيانات المجردة عند استهداف حياة واقعية سوف يكون لهما تأثير على إنتاج هذه Lal‏ 
هذا الشخص. كمشتبه به بالإرهاب بالفعل". ومن ثم يتم وضع الفرد تحت بؤرة المراقبة 
وممارسات مراقبة الدولة. وجعله TET‏ لنتائج وتداعيات 439$ NET‏ به «ous; Nb‏ على 
الرغم من عدم التيقن من هذا الاشتباه. وبعبارة 5,1 تتم معاملة الشخص بطريقة 
مختلفة من جراء التوقع بأنه رها يكون شيئاً ماء في حين أنه رها يُكن هذا الشيء 3l‏ 
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لا يكنه أو رما يرتكب هذا الفعل أو لا يرتكبه. وفي حين أن النوايا وراء هذا العمل 
رما تكون نوايا عظيمة وحسنة» إلا أن التوقع في هذه الحالة له تداعيات تتجاوز gie‏ 
الأحداث امتوقعة )2006 .(Harcourt‏ وكما هو الحال مع JUS CSI‏ الأخرى من التنميط: 
فإن الحوكمة التنبئية يتم توجيهها بشكل كبير من خلال خوارزميات الصندوق الأسود التي 
تعمل على بيانات ذات أصل غير معروف» وهي على وجه العموم منغلقة على حق الرجوع 
(النقد). فالحوكمة التنبئية كانت مثار القليل للغاية من الاهتمام النقدي أو ال مناقشات 
وذلك ها يتعلق بتأثيراتهاء وعلى الرغم من ذلك تم تطويرها بفعالية من أجل استخدامها 
في الحكومات والشركات. 


Modes of Governance and) أساليب الحوكمة والضوابط التقنية‎ 
: (Technological Lock-Ins 

بعيدا عن التحكم في الانسلال والتنميط التنبئيء فإن ثورة البيانات لها تأثيرات محتملة 
فيما يتعلق بتنظيم وتشغيل الحوكمة. وإذا وضعنا في الاعتبار الشبكة المتسعة لجمع 
البيانات» وقراراتها الدقيقة: فإن قلق الكثير من المعلقين ينبع من أن عصر ظهور البيانات 
ôu SII‏ يسبق pas‏ ظهور ما أصطلح على تسمىته dilog‏ الأخ .(Big Brother) „SY!‏ وهذا 
يعني أننا في عصر أضحت فيه الدولة والمؤسسات.تعرف وتتوقع الكثير جدا عن الأفراد من 
خلال مراقبة البيانات والتنميط التنبئي لدرجة أنهم يمتلكون السلطة لفرض أشكال قاسية 
وضارة من التحكم الانضباطي. 

وكما آشرنا إلى ذلك خلال هذا daill‏ فنحن نعيش وبدون شك 3( عصر المراقبة الزائدة 
بشكل مبالغ فيه. حيث أصبحت المراقبة أكثر اتصالا من أي وقت مضىء وهي مدعومة من 
خلال تزايد ثقافة السيطرة التي ترغب في الأمنء والاستقرار وتقليل المخاطر )2007 (Lyon‏ 
وهناء يتم تشريع نوع جديد من الحوكمة. وهو نوع يؤول فيه تنظيم جوانب dusza‏ 
من الحياة sss JI‏ إلى الأنظمة التقنية ال مملوءة بالتوكيل الثانوى Kitchin and Dodge)‏ 
1. فعلى سبيل JELI‏ فإن معرفة» ومعالجة وإدارة الانتهاكات المرورية تتم بشكل 
متزايد من خلال الأنظمة «LJ VI‏ والمسموح بها من خلال برنامج يقوم بمعالجة البيانات التي 
تتعلق بأرقام اللوحات» والسرعة»ء وحق الوصولء وإحالة هذه البيانات إلى قواعد بيانات 
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الملكية من أجل فرض غرامات أو خصم نقاط .(Dodge and Kitchin 2007a) JI JS o‏ 
وعلى النقيض من الأشكال التقليدية من الطمراقبة التي تسعى إلى تشجيع الانضباط GIUI‏ 
فإن الأنظمة الآلية تقو تقوم بإعادة L.S Z5‏ | السلوك بشكل فاعل Agre 1994; Kitchin and)‏ 
.(Dodge 2011‏ وق مثل هذه الأنظمة. فإن آليات إنشاء البيانات وتنظيمها تعتير مجالا 
مهما للغاية من النظام» وذلك بدلا من كونها leza‏ خارجا عن النظام. فعلى سبيل المثالء 
بدلا من أن يقوم عمال صناديق المحاسبة بإجراء الانضباط GIUI‏ معدل عملهم لأنهم Le)‏ 
أو رمالا يعرفون أنه 3 تتم مراقبتهم من خلال كاميرات ال مراقبة التلفزيونية ذات الدائرة 
امغلقة» فإن عمل مسح البضائع ومعالجة ال مدفوعات هي الوسائل التي يتم من خلالها 
مراقبة معدل العمل بشكل مستمر. وف مثل هذه الأنظمة/ فإن المراقبة وآثار البيانات 
المرتبطة بهذه المراقبة أصبحت مستمرة: ومتغلغلة. ومواظبة» ومتفاعلةء مع سلوك الخاضع 
لها ولكنها تقع خارج سيطرته )2012 (Cohen‏ 

إن البيانات التي تكونت بشكل Ui‏ لا يستخدم جميعها من أجل تشريع الإدارة الآلية 
ولكن هذا هو الاتجاه السائد بشكل متزايد» وخاصة للأنظمة عالية التنظيم. وعلاوة على 
ذلك. فإن الأساليب الجديدة من التحكم» إلى الآن» لا يتم السماح بها بالطريقة الصارمة 
التي توقعتها رؤية جورج أورويل (George Orwell)‏ في روايته eI"‏ الأكبر". فهذه 
الأساليب عادية وروتينية ومغرية وتشجع ال مواطنين على أن يشاركوا بفعالية وبتلقائية 
في ممارساتها )2012 alè U E (Kitchin and Dodge 2011; Cohen‏ وكما 
ذكر )2007( «Solovo‏ فإن البيانات الكبيرة لا تتعلق بشكل كبير مباشرة رؤية جورج 
أورويل ولكنها ترتبط بشكل أكبر برؤية كافكا (Kafka)‏ كونها تطرح قضايا عن الإجراءات 
الواجب اتخاذها فيما يتعلق باللامبالاةء الأخطاء الانتهاكات» الإحباط. نقص الشفافية, 
والاستعانة أكثر مما تطرحه عن التسلط والاستبداد. وعلى النقيض من ذلكء فبالنسية يلا 
قاله )2013( Boellstroff‏ فان امحاز الأماسي في البيانات الكبيرة واطراقة لس الروؤية 
الكلية. ولكن بالأحرى هو «ala!‏ فدلا من أن يكون الفرد mU‏ على نحو صرف لرقابه 
انتهاكية» يسلم الناس بحماس ببياناتهم من خلال وسائل التواصل الاجتماعي» أو من خلال 
الانضمام في برامج بطاقات الولاء... إلخ. وبغض النظر عن الصياغة التصورية للعملية: 
فمن الواضح أن هذه الأنظمة الجديدة لها تأثيرات فيما يتعلق بالسلطة والسيطرة: وتقوم 


انبا ثورة البيانات البيانات الكبيرة» والبيانات ال مفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها 


AVA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجزام  EcONLIBRARY‏ © 


المخاوف الأخلاقية, والسياسية» والاجتماعية: والقانونية 





بتشكيل التجارب والفرص الحياتية بطريقة مختلفةء وأن دور البيانات ومراقبة البيانات في 
مثل هذه الآنظمة يتطلب اهتماما نقديا إضافيا. 


إن من الطرق التي يتم من خلالها تحويل الحوكمة من قبل التقنيات التي تدعمها 
البيانات أن نجعل الحوكمة أكثر تكنوقراطية بطبيعتها (معتمدة على التقنية بشكل (AS‏ 
فعلى سبيل «JULI‏ فإن النزعة تجاه إدارة وتنظيم المدن من خلال أنظمة المعلومات 
والأنظمة التحليلية تعزز الأسلوب التكنوقراطي للحوكمة المدنية التي تفترض أنه من 
الممكن قياس ومراقبة جميع المجالات المدينة ومعاملة هذه المجالات على أنها مشاكل فنية 
يمكن التعامل معها ومجابهتها من خلال الحلول الفنية )2014 (Kitchin‏ وهي توضح ما 
أطلق Mattern (2013) ade‏ مصطلح "العقلانه الآدائية وما أطلق عليه Morozov)‏ 
2013( "مقاربة الحلول التقنية" حيث مكن تجزئة المواقف الاجتماعية المعقدة إلى مشاكل 
محددة بشكل دقيق تمكن حلها أو البحث عن أفضل الحلول لها من خلال الحوسبة. 
ومرة أخرى» فإن هذا يعد تجسيدا للبيانات الكبيرة. حيث يمكنها أن توفر إجابات لجميع 
ا مشاكل )2013 .(Mattern‏ ومن خلال التقاط وتمثيل الظواهر كسانات بيبشكل àl‏ أو 
لحظيء يصبح من الممكن من الناحية الظاهرية تخطيطء وفهم» وإدارة» وإصلاح الموقف 
أو المشكلة حال حدوثها. وقد أوضح )2013( Hill‏ آن "تفكير المدينة الذكية" ينم عن 
à ars‏ نظر تكنوقراظية ob‏ المدينة هي شيء يتعين علينا فهمه بالتفصيل كالمحرك أو 
محطة الطاقة النووية وذلك في حال كان لدينا بيانات كافية فقط. وأنه تبعا لذلك سيمكننا 
السيطرة على هذه المدينة من خلال القوة الغاشمة للعلم والهندسة. وف الواقع» فقد اقترح 
Matten (2013)‏ أن تحضر البيانات الكبيرة يعاني من تراكم البيانات» وهو افتراض أن جميع 
التدفقات والأنشطة الهادفة مكن الاحساس بها وقياسها. وداخل مثل هذا التفكير هناك 
افتراض واضح في الغالب وهو أن الكون تشكل من قبل plell‏ القابلة للمعرفة والقابلة 
للتحديد والتي تؤكد LJ‏ أنه لو كان بإمكاننا قياس جميع هذه ال معايير. فسوف نكون قادرين 
على التنبؤ والاستجابة بتمكن تام وفقا لذلك )2012 (Haque‏ وعلى الرغم من «US‏ لن 
يكون بمقدور الحلول التقنية بذاتها حل المشاكل الهيكلية المتأصلة في المدن OY‏ هذه الحلول 
لا تتعامل مع أسباب تأصل تلك المشاكل. ولكن بدلا من ذلك فإن هذه الحلول تمكن فقط 
من إدارة مظاهر تلك المشاكل بشكل أكثر فعالية. às‏ حين أن تقنيات المدن الذكية مثل 
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أساليب التحليل اللحظية والآنية يتم الدفع بها كوصفة للتعامل مع جميع قضايا الحوكمة 
المدنية: إلا أن هذه التقنيات في الغالب الأعم تداري الشقوق بدلا من إصلاحهاء إلا là!‏ 
واكب هذه التقنيات مجموعة أخرى من السياسات )2014 .(Kitchin‏ وممكن أن ينطبق 
الأمر نفسه على الطرق التكنوقراطية المطبقة ف بعض المجالات الأخرىء» فأساليب الحوكمة 
التي تقودها البيانات تضمن بالفعل تنفيذ إستراتيجيات مدعومة بالأسانيد ولكن يجب أن 
تكون مقترنة بالسياقء ومرنة» ومستهدفة بشكل ملائم» ولا يتم إدارتها ببساطة من خلال 
الأرقام والخوارزميات. 
ويتزامن مع ذلك الانتقاد القائل أن الحوكمة أصبحت مبنية على معرفة تامة وتكنوقراطية 
مفرطة ومع الخوف من أن يتم الاستيلاء عليها وتشكيلها بشكل صريح من قبل مصالح 
الشركات من أجل تحقيق مكاسب شخصية. وبالعودة إلى JULI‏ المتعلق ببرنامج المدينة 
الذكية ومثال الحوكمة البلديةء وكما أشرنا إلى ذلك في الفضل السابع فإن عددا من أكبر 
شركات خدمات البرامج والأجهزة يسعى بشكل فعال إلى التعاقد من الباظن غلى مجالات 
من الإدارة المدنية olg‏ تجعل من بضاعتهم جزءًا Y‏ يتجزأ وذات دور جوهري في LAS‏ 
مراقبة وتنظيم العديد من مجالات الحياة في المدينة )2013 (Kitchin 2014; Townsend‏ 
إن الهاجس والقلق النابع من خصخصة الإدارة المدنية ذو ثلاثة أوجه )2014 (Kitchin‏ 
« أولاً: أنه يعزز بشكل فعال الاقتصاد السياسي للليبرالية الجديدة والتحول نحو اقتصاد 
السوق في القطاع العام حيث يتم إدارة وظائف المدينة من أجل تحقيق الربح 
الخاص )2008 .(Hollands‏ 
٠‏ ثانيا: أنه يؤسس للقيد التقني الذي يجعل المدن مدينة وممنونة بالفضل لمنصات ومزودي 
خدمات تقنية معينة خلال مدة زمنية abso‏ مما يخلق مواقف احتكارية )2013 (Hill‏ 
والخطر في هذه الحالة يكمن في تأسيس تبعية للمسار المؤسسي مما لا يمكن إلغاؤه أو 
التحول عنه بسهولة )2012 (Bates‏ 
o‏ ثالثا: أنه يؤدي إلى حلول مغلفة أساسها "نظام واحد مناسب لجميع المدن الذكية" والتى 
لا تضع في اعتبارها إلا Sis‏ ضثيل dl‏ خصوصية وتفرد الأماكنء والناسء والثقافات» 
وتقيد إدارة المدينة على أسلوب تكنوقراطي ذي رؤية ضيقة للحوكمة )2013 (Townsend‏ 
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وإذا ما أستحضرنا الواقع» فإن شركة IBM‏ في الوقت الحال منتجاً يسمى "مركز عمليات 
IBM‏ الذي" الذي يجمع العديد من الأنظمة التي تم تصميمها لمدينة ريو دي جانيرو تي 
منتج واحد يمكن تطبيقه على أي مدينة Singer 2012c)‏ انظر Lail‏ السابع). ولا يعني 
هذا أن نقول إن القيود التي تفرضها الشركات y»‏ حتمي» ولكن من الواضح أن ذلك Le‏ 
رغبة عدد من أكبر الشركات العاملة في هذا المجال. وبالمثل» يتم استهداف أشكال أخرى 
من الحوكمة بشكل متزايد من خلال الشركات التي تسعى إلى إيجاد أسواق للحلول التقنية. 
ومرة أخرىء فإن تداعيات مثل هذه الأشكال من الحوكمة تتطلب الكثير من التدقيق. 


الخاتمة: 

ناقش هذا الفصل التداعيات الأخلاقية: والاجتماعية. والسياسية» والقانونية للتغييرات 
التى تحدث من جراء تكوين البيانات ودمج البيانات واستخدام البيانات.. ومن الواضح 
آنه في حين أن مثل هذه الممارسات لها فوائد بالنسبة للحكومات والشركات وال مواطنين. 
إلا أنها في الوقت نفسه لها تداعيات سلبية وتمييزية. وإذا وضعنا في الاعتبار السرعة التي 
يتغير بها مشهد «SLE‏ فإن مواكبة التطورات وتحديد الآثار المحتملة لهذه التطورات» 
ودراسة ردود الفعل الاجتماعية والقانونية المناسبة يعتبر تحديًا هائلا. وف الواقع هناك 
الكثير من الأسئلة الأساسية ال معيارية التي تتطلب دراسة تأملية والتي تتعلق من يمكنه 
تكوين مجموعات البيانات والوصول إليها ومشاركتها وتحليلهاء ولأي غرض وفي أي سياق 
وتحت أي معوقات أو قبود )673 :2012 .(boyd and Crawford‏ إن الحاجة إلى إجابات 
لمشل هذه الأسئلة pol‏ ملح وذلك إذا وضعنا في الاعتبار ا لمدى والتأثيرات المترتبة على 
مراقبة البيانات وانتهاك الخصوصية والأمن غير المحكم للبياناتء والتأثيرات الضارة للفرز 
الاجتماعي والاستبعاد. والطبيعة والأساليب المتغيرة للحوكمة. فحتى لو كانت الاستجابة 
سريعة ومبالغ فيهاء فإن الإجابات المترتبة ستكون متنوعة» حيث إن العديد من أصحاب 
المصلحة يسعون وراء إستراتيجيات بديلة من أجل التعامل مع المخاوف العديدةء بحسب ما 
يتضح من خلال المناهج المقترحة لتفتت وانتهاكات الخصوصية. ونتيجة لذلك» يمكن للمرء 
ol‏ يتوقع الكثير من ا مناقشات ف السنوات القادمة فيما يتعلق بإدارة العناصر العديدة 
في ثورة البيانات. وعلى وجه الخصوص. وكما ناقشنا في الفصل الثاني» فإنه من ا لمحتمل أن 
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يوضع عمل سماسرة البيانات تحت التدقيق المتزايد سواء من جانب الحكومة أو المواطنين. 

ومن منظور 3851" « من المهم للغاية أن يضطلع العلماء بدور فاعل في استقصاء ودراسة 
القضايا القانونية والسياسية والاجتماعية والأخلاقية التي تنشاً نتيجة لثورة البيانات» مع 
التتبع والإسهام في المناقشات العديدة المستمرة. يحتاج مثل هذا العمل إلى أن يشتمل من 
جانب على دراسات حالة تجرسية مفصلة توثق التأثرات المادية والاستطرادية الناتجة عن 
كيفية توظيف البيانات» ومن جانب اخر على البحوث والرسائل المعيارية والشاملة التي 
تحدد تأثيرات تجميع العديد من البيانات والطرق البديلة الممكنة. وحتى هذه اللحظة 
فإن معظم الإسهامات كهذا الفصل والأعمال التي يناقشها تكونت من الجانب الآخير مع 
352-9 القليل lac‏ فن اذز امات Le duo yox]‏ عض da SM‏ الاج اة القدرة دده 
ونتائج هذه الدراسات. إن مثل هذه الدراسات مهمة للغاية لأنها تكشف الطرق ال ملموسة 
التي تم من خلالها تقديم مبررات لتجميع البيانات» وكذلك اللهام التي يتم ممارستها وكيف 
يتم قبولهاء وإعادة تنقيحهاء ومقاومتهاء وإفسادهاء وانتهاكها من قبل المجتمعات» وهذه 
الدراسات توفر أيضا قاعدة أدلة يتم من خلالها تصور كيف هكن إعادة تأظير Jia‏ هذه 
الأنظمة أو إعادة تحديد الغرض منها. 
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الفصل الحادي عشر: فهم 859 البيانات 


(Making Sense of the Data Revolution) 


ناقش هذا الكتاب قضية أنه يتعين أن تكون هناك حاجة إلى تعاط أكثر نقدية وفلسفية 
مع البيانات وأن ثورة البيانات ما زالت قائمة ف الوقت الراهن. وفيما يتعلق بالأمر الأول 
ادعى البعض أن البيانات تمثل عناصر أساسية لإنتاج المعرفةء ومع «4L JS‏ فحتى الوقت 
الراهن لم تحظ الصياغة الوجودية للبيانات وال مجاميع ال محيطة بإنتاج البيانات واستخدامها 
بالاهتمام الكاني. وبدلا من ذلكء فإن التركيز كان منهجيا بصورة أكبر فيما يتعلق بتكوين 
البيانات: أو أن التركيز كان على الأشكال الاشتقاقية للمعلومات وال معارف. وفيما يتعلق 
بالأمر الثاني ادعى البعض أن تدرج البيانات الصغيرة ف البنى التحتية للبيانات وإتاحة 
الوصول للبيانات التي كان الوصول إليها محدودا في السابق. وظاهرة البيانات الكبيرة 
تدمر الابتكارات ولا تدعمها أو تحافظ عليهاء فهي تغير طبيعة البيانات من حيث حجم 
هذه البيانات» dgis wg‏ وشموليتهاء وعلاتقيتها ودلاليتهاء ومرونتها وتوسعهاء وتنوعهاء 
وانفتاحها وتبادليتهاء وهى السبب في ظهور مجاميع بيانات جديدة وطرق جديدة لفهم 
العام الذي نعيش فيه. إن التأثيرات التدميرية لثورة البيانات لها تداعيات هائلة على 
الحكومات والشركات والمجتمع ال مدني وذلك من خلال إنشائها لمعارف وممارسات جديدة 
مكن استخدامها من أجل إعادة صياغة كيف يمكن أن يتم حكم الناس» وكيف يمكن أن 
تتم إدارة امنظمات» وكيف مكن أن تتم زيادة القيمة والفائدة» وكيف o Sce‏ أن يتم تكوين 
رأس «JUI‏ وكيف يكن أن يتم تحسين الأماكن» وكيف هكن أن تتم إعادة تخطيط وممارسة 
العلم. وهي Lal‏ أثارت العديد من التحديات وطرحت الكثير من الأسئلة» ومكنت لوسائل 
أكثر شيوعا فيما يتعلق بمراقبة البيانات» وتقويض الخصوصيةء وتنميط الأشخاص والأماكن 
والفرز الاجتماعي» ومهدت لسن أشكال جديدة من الحوكمة. فهذا الفصل الأخير يحدد 
خطة طريق دلالية من أجل إدراك وفهم البيانات وثورة البيانات وذلك بالنظر إلى الفجوات 
الحالية في الفكر المفاهيمي والمعرفة. ويشير هذا الفصل إلى أن Jis‏ هذا الفهم بحاجة 
إلى أن يحدث بطريقتين: 991« من خلال التفكير الفلسفي الشامل والتحليل النقدي 


ثورة السانات السانات الكبيرة: والسانات المفتوحة؛ والىنى التحتية للسانات» والنتائج ا مترتية عنها Y‏ 





ANZ 


المكتبة الاقتصادية 
قناة المكتبة على ECONLIBRARY plashi‏ © 


الفصل الحادي عشر 


والمفاهيمي. والثانية» من خلال البحوث التجريبية المفصلة التي تتعلق «Job‏ وتشكيلء 
ووظيفية وتطور مجاميع البيانات. 


فهم السانات وثورة السانات (Understanding Data and the Data Revolution)‏ : 
إذا وضعنا في الاعتبار فائدة وقيمة البيانات» فهناك حاجة ملحة للنظر إليهم من وجهة 
النظر الفلسفية وا مفاهيمية. فالفلسفة»ء كما ادعى )1921( «Wittgenstein‏ هى التوضيح 
المنطقي للفكر» فكل مدرسة من مدارس الفكر تُحَدُ نظاما للأفكار ومنظورا لفهم العام. 
ومصطلح «ele‏ تتشكل كل مدرسة وتختلف عن المدارس الأخرى من خلال أربعة مكونات 
-الوجودية (Ontology)‏ والمعرفية (Epistemology)‏ والأيدلوجية (Ideology)‏ 
والمنهجية (Methodology)‏ - وهذه المكونات هي التي تحدد معاييرها. فالوجودية هي 
مجموعة من ال معتقدات التي تتعلق بطبيعة الوجود. وهي تهتم le‏ هو موجود وما مكن 
ملاحظته ومعرفته. وبالنسبة للبيانات» فالوجودية:تتعلق d sale‏ البيانات. ما الطبيعة 
الأساسية للبيانات؟ أما المعرفية فهي تتعلق بكيفية استخلاص المعرفة أو الوصول إليهاء 
وهي الافتراضات عن كيف LSe‏ معرفة العام بمعنى كيف أصبح بإمكاننا معرفة البيانات؟ 
وهي أيضا تتعلق بكيفية حشد البيانات في ممارسة التعلم. أما الأيدلوجية فهي تتعلق 
بالسياسات الضمنية والغرض من إنتاج المعرفة؛ والمدى الذي يسعى من خلاله ال منهج لي 
يكون محايدا معنی أن يكون موضوعيًا وغير تقويميء أو المدى الذي يسعى من خلاله 
المنهج بفعالية للتدخل وتغيير العالم. وحيث CUS‏ ينطوي تحت مفهوم الأيدولوجية العديد 
من الأسئلة مثل هل البيانات سابقة للحقيقة؟ وهل هي سابقة للتحليل وبلاغية؟ أو هل 
البيانات اجتماعية el‏ سياسية؟ وهل تمت صياغة هذه البيانات بفعالية؟ أما المنهجية 
فهي مجموعة الإجراءات المستخدمة من أجل تفعيل سؤال أو نظرية ضمن الافتراضات 
الوجودية أو المعرفية للفلسفة الإجمالية للبحث. وهي تشكل اختيار الأساليب التي يتم 
من خلالها تكوين وتحليل البيانات» فال منهجية والأساليب مرتبطان بشكل 859« ولكن ما 
طبيعة هذه العلاقة سنهما؟ 
لقد شرع الفصل الأول في تقديم إجابات أولية عن هذه الأسئلة وقدم أيضا صياغة لفهم 
البيانات من منظور فلسفي مكن من فصل هذه البيانات عن كونها مجرد "مواد خام" 
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للمعلومات والمعارف. فالبعض ادعى أن البيانات اجتماعية ومادية: وأن البيانات لا تمثل 
العام فحسب» ولكنها تنتج هذا العالم بشكل فعال. وادعى البعض أيضا أن البيانات لا توجد 
بشكل مستقل عن الأفكار» والأساليبء والتقنيات» والناس» والسياقات التي تنتج» وتعالج: 
وتديرء وتحللء وتخزن هذه البيانات. وق الواقع: يتم تنظيم البيانات وتخزينها في قواعد 
البيانات والبنى التحتية للبيانات التي تشكل لب المجاميع الاجتماعية الفنية المعقدة. وكما 
تم الإشارة إليه بالتفصيل ف الفصل الأول» تشتمل هذه الأنظمة على أنظمة الفكرء وأشكال 
المعرفة: والتمويلء والاقتصاد السياسيء وأنماط الحاكمية. والتشريعات» والماديات» والبنى 
التحتية: والممارسات: وال منظمات وال مؤسسات. والذاتيات والمحتمعات» والأماكن والأسواق»: 
وكل نظام من هذه الأنظمة يشتمل على عناصر عديدة (انظر الجدول .)١ - Y‏ فهذه 
العناصر تعمل سويا بطرق متعددة: واتفاقية وارتباطية وذلك من أجل الإنتاج الاستطرادي 
وامادي مجاميع البيانات (انظر الشكل .)١ - Y‏ لقد تم عبر هذا الكتاب مناقشة العديد من 
هذه المجاميع مثل البنى التحتية البحثية. والمحفوظات الوطنيةء والبنى التحتية السيبرانية: 
ومشروعات البيانات المفتوحة» وسماسرة LLI‏ وأنظمة البيانات الحكومية» وأنظمة 
الأعمال. وكل واحدة من هذه ال مجاميع» بالرغم من أنها تتشارك في قواسم مشتركة. إلا أنها 
تتطور وتعمل بطرق مختلفة. وهي تتكون من مجموعة من الأنظمة والعناصر التي تتوسع 
بشكل مختلف ue)‏ سبيل JULI‏ من المنظمات. والماديات ال محلية. إلى الفرق امنتشرة. 
والقوانين الوطنية. وفوق الوطنية إلى الأسواق العامية) ولكنها على الرغم من ذلك مرتبطة 
داخل LSS‏ فريدة. 

إن مثل هذه الصياغة تمكننا من جهة من التفكير في إنتاج البيانات وكيف يمكن صياغة 
هذه البيانات بأشكال متعددة من النواحي الفنيةء والسياسية:» والاقتصادية» والأخلاقية, 
وامكانية: والزمانية» وصياغة استخدامات هذه البيانات والعمل الذي تقوم به (à‏ العام 
وتمكننا من الجهة الأخرى. من توجيه البحوث التجريبية التي تتعلق بمجاميع البيانات 
(انظر الجزء التالي). وهيء على الرغم من EUS‏ مجرد مجموعة واحدة من الطرق ال محتمله 
لفهم البيانات» ومما لا شك فيه أنه بمرور الوقت سيتمكن العلماء من إنتاج مجموعة 
من المناظير التي يمكننا من خلالها فهم البيانات. إن تنوع وجهات النظر سوف يؤسس 
لعناصر تكميلية مثمرة للآفكار الجديدة ووجهات النظر المفاهيمية من أجل توجيه البحوث 
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التجريبية. وربما تشتمل هذه على تنظير البيانات من خلال منظار تأسيسي (بنيوي) أكبر 
يركز على دور هذه البيانات في تشغيل الرأسمالية المتأخرةء أو يستفيد من مفاهيم ما بعد 
البنيوية لدولوز (أحد eal‏ الفلاسفة الفرنسيين في النصف الثاني من القرن العشرين) التي 
تتعلق بأساليب الحوكمة الجذمورية (الجذمور: مفاهيم تتوزع على شبكة» بحيث تلتقي 
مع بعضها دون اشتراط اللزوم)ء أو الانتقادات النسائية ما بعد الاستعمار للنوع الاجتماعي 
والإنتاج المسَيّس وتوظيف البيانات. وبغض النظر عن المنظورء فالمطلوب هو تفكير عميق, 
وحريص ونقدي مع تنظير العمل من خلال دراسات الحالة التجريبية. 

إننا لسنا بحاجة إلى استكشاف الصياغات المفاهيمية للسانات فحسب» ولكننا بحاجة: 
كما ناقشنا في الفصل الثامنء إلى دراسة كيف تطرح ثورة البيانات بعض التحديات أمام 
الفلسفات الحالية للعلوم. فالبيانات الكبيرة وتحليلات البيانات توفرء على وجه الخصوص› 
إمكانية ظهور نموذج علمي xus‏ أي نهج معرفي جديد يتميز بكثافة البيانات ويتسم 
بالاستكشافية بطبيعته وذلك من أجل تطوير النظرية العلمية. فالمحاولات الأولية للتفكير 
فيما يمكن أن يعنيه مثل هذا التحول النموذجي كانت في غالب الأحيان مرتبكة Alang‏ 
وتعزز شكلا من أشكال التجريبية التي يجدها الكثير من العلماء إبعادية وخطوة إلى الخلف 
وليست خطوة إلى الأمام. ويتعين استبدال هذا بمنظور أكثر فعالية لما يمكن أن يتكون 
منه العلم المساق بالبيانات من حيث معتقداتة الفلسفية والمنهجية. لقد بدأ مثل هذا 
التفكير SKIL‏ ومع ذلك فهناك حاجة ملحة إليه من أجل مواكبة إيقاع التغير التقني ونشر 
المنهجيات المخصصة والبراجماتية (الواقعية)ء وكذلك من أجل استبدال الأشكال التجريسة 
الضعيفة المنتشرة. فالتحول النموذجي أقل احتمالية في العلوم الإنسانية والاجتماعية» ولكن 
على es JI‏ من البيانات الكبيرة» فإن البيانات المفتوحة والبنى التحتية للبيانات توفر منهجيات 
وطرق جديدة للقضايا الاجتماعية» والثقافية. والسياسية» والاقتصادية: والتاريخية. فالفصل 
الثامن استعرض خطة تفصيلية بالمزايا والانتقادات النسبية المتعلقة بالعلوم الإنسانية 
الرقمية والعلوم الاجتماعية الحسابية التي يتم تطويرهاء ولكن هناك حاجة ملحة لمناقشات 
كاملة وصريحة من شأنها استخراج النتائج من التحول المعرفي ف الفكر والممارسة. ويجب أن 
تقوم مثل هذه المناقشات أيضا بتقييم دور ومزايا دراسات البيانات الصغيرة» وكذلك المناهج 
الهجينة التي تمزج أساليب ووسائل البيانات الصغيرة والبيانات الكبيرة. 
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ومثل هذا التفكير يجب أن يواكبه تفكير آخرء موجه بشكل أكبر تجاه المعيارية» في 
تكوين واستخدامات البيانات» وإنشاء وتشغيل مجاميع البيانات. وكما ناقشنا في الفصل 
العاشرء تطرح ثورة البيانات عددا من القضايا الشائكة وذلك فيما يتعلق بالمدى الذي يتم 
على أساسه التقاط الحياة اليومية في مجاميع البيانات» وكيف أن بنية البيانات للناس تفوق 
وتضع قيودا على حياتهم بجميع أنواع الطرق غير المتوقعة. فعلى سبيل JÈL‏ هل يجب 
أن يتحلى الناس بالمقدرة على الوصول إلى جميع البيانات المتعلقة بهم» ols‏ يكون لديهم 
الحق في تصحيح والاعتراض على هذه البيانات» أو تحليلات البيانات أو التنميط؟ Jla‏ أي 
مدى يجب أن يكون الناس قادرين على ممارسة الحق في أن يتم نسيانهم؟ وما هي الطرق 
التى يمكن من خلالها إخضاع سماسرة البيانات لرقابة وتنظيم مستقلين» وخاصة عندما 
تكون بياناتهم وخوارزمياتهم تؤثر في الفرص الحياتية للناس؟ وما هو مدى تأمين الأنواع 
المختلفة من البيانات ؟ وما العقوبات المحتملة على انتهاكات هذا التأمين؟ وما الحدود 
ا مشروعة للحكومات في تجميع ودمج البيانات عن مواطني هذه الحكومات؟ وإلى أى مدى 
مكن إشراك المؤسسات ف أعمال الحكومات وأنظمة الحوكمة؟ فهذه القضايا تتعلق iale‏ 
المجتمع المرغوب فيه في sae‏ وفرة البيانات: والإجابات عن هذه الأسئلة لها تداعيات 
وخاصة فيما يتعلق بإمكانية إعادة تصور وإعادة تهيئة مجاميع liag OLLI‏ يشمل 
الأشكال الجديدة من الحوكمة والتنظيم. فالعلماء القانونيون بدئوا بالفعل في التفكير في 
بعض القضايا مثل نتائج خصوصية البيانات SuI‏ وبدؤوا UIS‏ في تقديم طرق بديلة 
للتعامل مع أكثر الآثار ضرراء ولكن من الواضح أن مثل هذه القضايا بعيدة كل البعد عن 
الحل» وآنها ستكون محل تركيز المناقشات المتطورة والصراعات التشريعية: وأن هناك حاجة 
ملحة للإسهام في هذا الحوار الفعال والصريح والمستمر. 

ويتزامن مع تطوير فهم مفاهيمي ومعياري أعمق وأفضل للبيانات» الحاجة إلى توفير 
وجهات نظر شاملة نقدية وكلية عن المنى التحتية للسانات واسيانات ال مفتوحة واسيانات 
الكبيرة وتداعياتهم. لقد قدم هذا الكتاب تحليلا شاملا بدلا من طرح فرضية تستند إلى 
بحث تجريبي شامل» واستفاد من الكتابات الأكادمية والإعلاميه والصناعية. فهذا النهج ذو 
فائدة لأنه يجمع الأفكار والملاحظات bgu‏ من مصادر متعددة وذلك من أجل تقديم نظرة 
أعم وأشمل عن المشهد المنتشرء مما يساعد على رسم وتصور الديناميكيات الأكبر» ودراسة 
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التأثير ات ا محتملة لها. ومع ذلك وعلى الرغم مما سبق» فإن المنظور العام الصعب 
والتأملي. والشامل لثورة البيانات لا يزال ضعيفا في الواقع العملي. وبدلا من ذلكء فهناك 
مجموعة من الكتب وعلى وجه الخصوص في مجالات الإدارة» والأعمالء والمجالات التقنية 
تعمل بشكل كبير على دعم البيانات ولكنها تفتقر للمنظور النقدي. وعلى النقيض من 
ذلك» فالمطلوب تقارير متعددة الاختصاصات ومعقدة ف تفكيرها. وف حين أنه من المفيد 
دراسة ثورة السانات من خلال منظور متعدد الاختصاصات والأوجه: إلا أن هذا المنظور 
مقيد بشكل جذرى وذلك بالنظر إلى الأجندة الشاملة والآثار ASAI‏ وعلى نحو مشابهء فإن 
المفهوم القائل بأن ثورة البيانات تنتج البيانات التي يمكن تفسيرها خارج سياقها أو المعارف 
خارج مجالها المخصص بحاجة إلى أن يتم إلغاؤه. وبدلا من ذلك فمن الضروري الاستفادة 
من الأفكار والمدارك عبر الإختصاصات» حيث يعمل العلماء الذين يتمتعون بخبرات مختلفة 
[on‏ من .أجل تقديم صورة أكثر شمولا (Ruppert 2012) REE‏ 
وعلاوة على ما «as‏ فإن التحليلات أوجدت حاجة لكي نكون حريصين ألا 3/53 إلى 
الجدليات التافهة التي إما تحدد بشكل انفعالي حالة البيانات الكبيرة» والبيانات المفتوحة. 
والبنى التحتية للبيانات» أو توفر TH‏ مستحكما AS] aoo‏ نتائجها CX‏ فاطوقف لا 
يكون اما TY‏ أو Jagal‏ أو TN‏ أو da‏ إلا فيما ندرء وعلى النحو الذى تطرحه الجدليات 
الانفعالية. وبدلا من ذلك يتعين bale‏ أن نقر ob‏ التطورات الحادثة اتفاقيةء وارتباطية 
ASL wg‏ وهی تنتشر بطرق فوضوية وأحيانا تناقضية وتباينية. وكما أشرنا إلى ذلك في 
الفصل التاسعء تعمل مجاميع البيانات في الغالب على كل من الإجبار والتحرير بشكل 
فوري ومتزامنء وأن مستهلي البيانات أحمانا يكونون هم منتجی السانات» olg‏ الأنظمة 
تسعى إلى استنطاق المستخدمين بطرق عديدة. وعلى هذا النحوء فإن المجاميع غالبا ما 
تكون متشابكة ويتعين أن يتم فتحها وتفريغها بشكل حذر وذلك من أجل إظهار تدرجاتها 
الرمادية المتعددة. وعندما توجد تأثيرات تعمل بطرق مضرة وتمييزية» فنحن بحاجة إلى 
تحديد الاستجابات الاجتماعية والقانونية المناسبه التي تحمي الحقوق الفردية والجماعية؛ 
ولكنها لا ترفض الكل لعدم رضاها عن الجزء. 
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دراسة مجاميع البيانات :(Researching Data Assemblages)‏ 
هناك ضرورة ملحه لإجراء بحوث تجريبيه مفصلة عن 9559( وعملء وتعزيز مجاميع 
البيانات وذلك من أجل مواكبة وتعزيز التحليلات النقدية والمفاهيمية الآعم والأشمل. ففى 
الوقت الحاليء LY‏ فهم متعمق قليل بكل من البناء الإجمالي لمجاميع البيانات وأجهزتها 
وعناصرها الفردية. ونتيحة UJ‏ هناك dalo Eb‏ لإجراء دراسات dlo‏ تتتبع الترتيبات 
الفنية الاجتماعية لكافة المجاميع» مثل تجميعة بيانات لسمسار ما أو البنية التحتية لسانات 
بحث ماء أو حركة البيانات المفتوحة في مدينة ماء أو التوثيق المفصل ON UL‏ معينة من 
Al‏ امجاميع: مغل علم الاجتماع: والاقتصاد السياسي (Hackathons) Slay Gn‏ 
ومنتديات العطل الأسبوعية لمجموعات الاختصاص (Data Dives)‏ أو مجتمعات الممارسة 
داخل قطاع ما في البيانات الكبيرة. وبشكل نموذجيء فإن مثل هذه الدراسات ستكون 
دراسات مقارنة بطبيعتهاء تقارن التكرارات في تجميعة ماء على سبيل JELI‏ عبر الأماكن أو 
البيئات» أوعبر أنواغ امتختلفة منالتجميعة. ومن ,شان مثل يِحَوْت المقارنة:هنذه أن تمكن 
من تحديد العموميات والخصوصيات» وكذلك الطرق الاتفاقية والارتباطية المتنوعة التي 

تتسع من خلالها التجميعة ليتم تشكيلها 

وهناك طرق عديدة يمكن من خلالها تفعيل مثل هذه البحوث. وهي تشمل تحليلا 

البيانات» كما تمت مناقشته ف الفصل السادسء وذلك من أجل تحديد تركيب تجميعة 
ما والارتباطات والعلاقات بين العناصر. وسيكون لمثل هذا النهج فوائد عديدة وذلك من 
خلال استخدام 888 التنقيب عن البيانات والتعلم JM‏ شن Jel‏ تحديد الأنماط داخل yeg‏ 
مجاميع كبيرة للبيانات» وكذلك من أجل تأسيس قوة نسبية للروابط. وهذا من شأنه أن 
يوفر تفسيرا واسعا ومقارنا للمجاميع وتشغيل هذه المجاميع. وعلى الرغم من ذلك وفيما 
يتعلق بفهم السياقء والاتفاقية والارتباطية المتعلقة بتجميعة ما -التداخل المعقد للكائن 
ومحيطه - فإنه من المحتملء رها بشكل ساخرء أن مجموعة من المنهجيات الخاصة بالبيانات 
الصغيرة قد توفر A‏ إدراکا تنويريا Bo‏ وؤتشتمل هذه المنهجدات» على سبل JULI‏ 
لا الحصرء على منهج علم الأصول (Genealogies)‏ ومنهج (Deconstruction) 4L$ JI‏ 
ومنهج الأعر اق والثقافات (Ethnographies)‏ ومنهج مشاركة الملاحظ Observant)‏ 
3+ وهي تمثل de gama‏ من المنهجيات التي أبدت استخدامها ق السابق 
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فسن 155 فهم البرامج )2011 (Kitchin and Dodge‏ والتخطيط );2009 Dodge et al.‏ 
.(Kitchin et al. 2012 a‏ وتسعى كل منهجية إلى أن تحدد — بشكل دقيق الظواهر 
الاجتماعية» وكما بينت العناصر الأحد عشرء فإن مجاميع البيانات تعتبر اجتماعية بشكل 
كلى. ومن خلال استخدامها كمجموعة. فإن الإنتاج المادي salas f‏ امنتشر لمجاميع 
البيانات مكن 455525 لأغراض cale‏ مما يوفر ما أطلق عليه )2013( Wang‏ مصطلح 

"البيانات الكثيفة"» أي الأفكار والقصص السياقية عن البيانات وإنتاج البيانات. 


إن علم الأصول يستخدم كثيرا من أجل تتبع الانتشار العرضي لنظام الأفكار أو لمجموعة 
من الأفعال عير الأوقات والأزمان: وذلك بدلا من إنتاج تأريخ ii‏ سليم Crowley)‏ 
2009(. وهذا يوضح كيف أن الج يتن على «sou!‏ ولكنه لا يتحدد بالضرورة من 
خلاله يطرق du‏ مسسية بسيطة. وعلى هذا النحوء يتم توظيف علم الأصول من أجل 
الحل والفهم بشكل تاريخى للتكرارات المتناقضة واممتغايرة اعبات واملعقدة؛ والمتعددة 
لأحد مجاميع «5L UI‏ أو أحد عناصرها وكذلك الفهم للانتشار المتطور والقائم للأفكار, 
والقرارات» وا معوقات. والأفعالء واللاعبين الذين أسهموا في تطور هذه المجاميع. TM‏ الى 
جنب مع النهايات المسدودة والإخفاقات الواضحة )1977 (Foucault‏ وعند فعل ذلك 
فإن هذا يحدد نقاط التجمع حيث يحتشد الناس أو الأفكار ES‏ ويتسببون i$‏ ظهور 
مجاميع جديدة: وكذلك الطرق ال معقدة والفوضوية التي تتطور من خلالها هذه المجاميع 
بعد ذلك. وف حال ثورة & البيانات» يمكن توظيف منهج ele‏ الأصول من أجل 3 تتبع تكوين 
وتطور البيانات المفتوحة والبنى التحتية للبيانات والبيانات الكبيرة بشكل أكثر عمومية, 
والتحسيد ال محدد لها. 

فعلى سبيل JÈL‏ يمكن لشخص ما أن ينتج تأصيلا مفصلا لتطور حركة البيانات المفتوحة 
بتعبيرات عامة. من خلال تتبع ظهور اللاعبينء والمنظمات. ونماذج التمويلء Yl‏ 
والأحداث مرور الوقت وعبر الزمنء والترابطات والتحالفات والخلافات بينهم؛ وتأثيراتهم 
على إعادة تشكيل مشهد البيانات من خلال إعادة تحديد السياسات التى تحيط بالحكومة 
التي آنتجت» واحتفظت» وكشفت Jio‏ هذه البيانات من أجل استخدامات أعم وأشمل. أو 
كن [الشخص آن يشرع فى قعديد OUS dol‏ فردي مقل مؤسسنة dll‏ للفتوعة: وهي 
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مؤسسة غير ربحية تأسست ف العام 2004 ف المملكة اممتحدةء ونمت بسرعة لي تصبح 
حركة دولية مؤثرة تطالب بالبيانات المفتوحة والحكومة المفتوحة. وهناء يمكن أن يسعى 
الفرد تجاه تتبع نشأة ال منظمة. وتطور مهمتها وقيمهاء وتطور البنى التحتية» ÅS galg‏ 
والتمويلء والأنشطة:. والبرامج والإصدارات» وانتشار تأثيرها وتفاعلاتها مع الهيئات الأخرى 
وهكذاء وذلك من أجل فهم الطريقة الاتفاقية والارتباطية لتوسعها وعملها على سبيل 
«JULI‏ وكذلك موقعها الحالي وسلطتها ضمن حركة البيانات المفتوحة الآعم. 

إن إجراء تحليل علم الأصول عادة ما يصاحبه الاستفادة من التفكيك» وهذه الطريقة من 
التحليل تجرد وتكشف ا معاني داخل النصوص ال مفهومة بشكل واسع مثل النصوص «Sl‏ 
والصورء والخرائط والآحاديث» ومزيج من هذه الأشياء تشكل في العادة المحتوى للكتيبات 
والمواقع الإلكترونية. فمن المفهوم أن النصوص هي الوسيط لكل من الرسائل الصريحة 
والضمنية» ومن خلال التفسير التشريحي للنص» يمكن فهم والكشف عن معان أعمق. ومن 
ناحية الجوهرء فإن التفكيك يبحث فيما يتجاوز الإشارات السطحية والقيم الاسمية لي 
als;‏ القراءات المسلم بها للنص وذلك من أجل الكشف عن ا معاني المخفية بداخله» أو ربط 
امعاني المبسطة بشكل محكم )1989 (Burman and MacLure 2005; Harley‏ فالتفكيك 
هو قراءة نقدية تستخدم أساليب مثل استبدال المعاني أو القوة المحتملة: أو تحديد نقاط 
التناقض أو التباين لأجل حل النصية البينية والتضمين داخل الماديات والسياقات «esI‏ 
والتفكير في وضعية المتحدث والجمهور المستهدف له )2005 (Burman and MacLure‏ 
وكما أشرنا إلى ذلك بالتفصيل ف الفصول الثاني والثالث والسابع» فإن البيانات المفتوحة 
CoL ile coU AL‏ الكيزة iS los. lo: SSE‏ حمسا alls dad]‏ عي 
إلى إقناع الناس» والشركات» والمؤسسات منطقها من أجل دعم وتبني والاستثمار في مبادئها 
ومنتجاتها. فالأنظمة الخطابية هذه ليست ble‏ ولكنها معقدة وفوضويةء فهي مزيج من 
المصالح المتعاونة والمتنافسة. ومن خلال استخدام التفكيك» فإن الأنظمة الخطابية لتجميعة 
ما أو عناصر duse‏ في هذه التجميعة. مثل الفئات العديدة في حركة البيانات ال مفتوحة أو 
شركات معينة تعمل على تعزيز حلول البيانات الكبيرة على القضايا ا مدنية» OSE‏ تجريدها 
وتفكيك رسالتها وتكوينهاء مما يكشف عن «3lsll‏ والأيدولوجيات (المعتقدات): والسلطات 
الكامنة داخل تصميمها وعرضها. 
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وتوفر دراسات الأعراق والثقافات تحليلات شاملة وهائلة لمجتمعات الممارسة من 
خلال التوثيق التفصيلي لتنظيمهاء وعملهاء وثقافتهاء وقواها المحركة الداخلية وارتباطاتها 
الخارجية )2000 (Herbert‏ وعلى نحو نموذجيء يوظف ال منهج الإثنوغرافي (وصف 
الأعراق والثقافات) مزيجا من مراقبة المشاركين التي يتم القيام بها عبر فترة زمنية ممتدة, 
ومقابلات شخصيه متعمقة مع مجموعة كبيرة من ال مستفيدين الداخليين والخارجيين» مع 
تعزيز كل ما سبق بأساليب أخرى مثل القراءات التفسيرية للوثائق والأدوات ذات الصلة 
مثل المواقع الإلكترونيةء وتبادلات البريد الإلكترون» وأماكن العمل... إلخ. ومن الناحية 
الجوهرية» يسعى ele‏ دراسة الأعراق والثقافات إلى الفهم الدقيق للعام الحياق ملجتمع 
ما - علاقاته dae ze VI‏ وايقاعاته المتواترة. dileag‏ الثقافية: وأنماط السلطة:. واتخاذ 
القرار فيه» وطرق كينونته.... إلخ - من أجل فهم كيف تشكل هذا المجتمع وكيف ينمو 
بشكل مستمر )2007 .(Crang and Cook‏ ويذهسب الباحث 1 تاا تقديم 
وصف سطحي لتوثيق الطرق ال معقدة التي تعمل من خلالها ا مجتمعات من خلال كونها 
متضمنة داخل العلاقات والممارسات التي يتم دراستها. ومن شأن دراسة الأعراق والثقافات 
مجاميع البيانات أن تق بعد ذلك أوصافا تفصيلية lal S‏ عن كيف تم تكوينها وكيف 
تعمل على أرض الواقع. فعلى سبيل JELI‏ فإن دراسة الأعراق والثقافات لمؤسسة ال معرفة 
المفتوحة سوف تتكون من باحث تم تضمينه Jalo‏ تلك ال منظمة. وهو يشارك في التخطيط 
للاجتماعات» والأنشطة. والفعاليات» ويراقب تفاعلات العمال ويجرى مقابلات شخصية 
مع ال مستفيدين الأساسيين للحصول على مدارك مباشرة حول عمليات اللاعبون الأساسيون 
في حركة البيانات المفتوحة. وكيف يتم تأسيس وإدارة المكونات العديدة لمجاميع البيانات 
(بمعنى أنظمة الأفكار؛ والاقتصاد السياسي؛ وأنماط الحاكمية؛ واطماديات؛ والبنى التحتية؛ 
إلخ) داخلها وعبرها. وعلى نحو مشابه: يمكن للفرد أن يجري دراسة الأعراق والثقافات 
داخل بنية تحتية معينة للبيانات: أو على سمسار للبيانات» sl‏ داخل شركة للبيانات SII‏ 
أو داخل elgi‏ معينة من الفعاليات مثل سباقات البرمجة أو المعارض وامؤتمرات الصناعية 
أو فرق البيانات الكبيرة داخل الحملات الانتخابية... إلخ. 

ويمكن أن يتم دعم مثل هذه الدارسات للأعراق والثقافات من خلال مشاركة 
daz MU‏ وهذا نوع من الدراسة الذاتية للأعراق والثقافات حيث يجري الباحث 


۲۰ 859 البيانات البيانات الكبيرةء والبيانات المفتوحةء والبنى التحتية للبيانات» والنتائج المترتبة عنها 


AVA 


المكتبة الاقتصادية 


قناة المكتبة على ECONLIBRARY plashi‏ © 





فهم ثورة البيانات 


دراسة مستدهة لارتباطاتهم وارتباطات الناس الآخرين بظاهرة أو ممارسة ما 
.(Crang and Cook 2007; Morton 2005)‏ وفيما يتعلق بثورة السانات:» من 
الممكن أن يتم مشاركة الملاحظين بحيث يكونون جزءا من فريق يبني البنى التحتية 
للبيانات» أو يكونون أعضاءً في حركة البيانات المفتوحة» أو يعملون كعلماء للبيانات 
(Als;‏ البيانات الكبيرة من أجل معالجة"قضية مح gU]‏ :هوف i Jie‏ 
النهج يعتبر في الأصل تمرينا للانعكاس الذاتي» وهو تدريب شخصي وغير موضوعي» 
حيث يسعى الباحث lialo‏ وبدقة بالغة لدراسة ممارساته وممارسات الاخرين 
في مجال ما حيث يكون à Lad Ley‏ هذا المجالء فالفائدة الأساسية Jib‏ هذا 
ا منهج تتمثل في أن الباحث يدرك بشكل كامل ال مشهد المتنوع والمعقد من النواحي 
الاجتماعية. والسياسية: والاقتصادية والذي يعمل من خلاله هذا الباحث ويعتبر 
أحد المشاركين الفاعلين فيه ويتعرض للعمليات ال متعددة الجارية. ويظل الانتقاد 
الأساسي ال موجه Jib‏ هذا المنهج هو أنه من الممكن بدرجة كبيرة أن ينثني الباحث 
ويوضع في مكان ما بشكل شخصي» مما يفقده التمثيل العريضء ورها تتم الاستفادة 
من هذا المنهج بشكل أمثل إذا ما تم دمجه مع طرق أخرى توفر Blu‏ أعم وأشمل. 
إن هذه الطرق JE‏ مجموعة dijo‏ من مجموعة من الطرق ال محتملهة لفهم مجاميع 
البيانات poleg‏ هذه المجاميع. ومما لا شك 443 Ol‏ الكثير من هذه المناهج سوف يتم 
توظيفها من أجل إجراء بحوث تجريبية على طبيعة ثورة البيانات المنتشرة: إذ يوفر كل 
منهج رؤى مختلفة. وفي الواقع» فإن ا منهج الذي يستخدم طرقا مختلطة تمزج بين الرؤى 
السياقية المتعمقة للدراسات النوعية التي تستهدف البيانات الصغيرة وبين الدارسات الأعم 
"E‏ توظف تخليلات Lu‏ رما يكون :سيلا مفندا لاتباعه. وف مثل هذه الدراسة. 
من الممكن استخدام تحليلات السيانات من أجل تقديم منظور شامل مجاميع «bL.‏ أو 
الروابط أو التداخلات بين المجاميع: والتي يتم اتباعها بعد ذلك من خلال البحوث الأكثر 
تركيزا باستخدام الطرق التي تم تفصيلها من أجل توفير رؤى متعمقة للعلاقات والعمليات 
السارية ذاخل وبين هذة الغناضر. أو من الممكن أن يكون هذا المزيج مزيجا LaS‏ صرفا 
فيما يتعلق بالصيغةء وذلك على النحو الذي تمت الإشارة إليه بالتفصيل ف المناقشات بشأن 
علم البيانات في الفصل الثامن» حيث تم تبني التحليل التفسيري لتجميعة البيانات بشكل 
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أكبر من اختبار الفرضيات التقليدي من أجل تحديد أكثر العناصر الفاعلة ظهورا. ويمكن 
أن يعمل هذا المنهج أيضا بشكل عكسيء حيث يتم استخدام البحوث المتعمقة المركزة من 
أجل توجيه انتشار تحليلات البيانات عبر عينة أكبر بكثير. وفي UIS‏ الحالتين» فإن المرحلتين 
الأولى والثانية تعملان بتناغم بعضهما | مع بعض من أجل تعزيز المدارك والمعارف. ففي 
الحالة الأولى» يتم استخدام الصورة الأعم من أجل المساعدة في صياغة الفهم وتعميقه وقرنه 
بالسياقء آما في الحالة الثانيةء فإن الفهم المتعمق يوفر الأساس محاولة تأسيس أو وضع 
تفسير أعم وأشمل. 


أفكار ختامىة: 

لا تزال ثورة البيانات في طورها التمهيديء ولكنها تنتشر بسرعة بالغة. فخلال عدد 
من السنوات لا يتجاؤز أصابع اليد الواحدة: كان للبيانات المفتوحة والبيانات الكبيرة 
والبنى التحتية للبيانات تأثيرات كبيرة على مشهد البيانات» وتزامن هذا مع مناقشات 
صوتية حماسية تعلن عن التأثيرات الإيجابية الخطيرة لها. إن سرعة التطورات التي تحدث 
تعني أن التحليل النقدي الموسع؛ والمتعمق» وال مدروس يجد صعوبة بالغة في مواكبة تلك 
التطورات. ومما لا شك فيه أنه خلال السنوات القليلة القادمة سيكون هناك فيضان 
حقيقي من مثل هذه الدراسات التي تسعى إلى توثيق طبيعة وآثار مجاميع البيانات 
الناشتة. وكما ادعى البعض خلال هذا الفصلء فهناك حاجة ملحة لهذه الدراسات. إن 
هذا العمل سوف يحدد من جانب الطرق ال مناسبة لفهم ثورة البيانات» من خلال كل 
من التفكير المفاهيمي والدراسات النقدية. وعلى الجانب الآخرء سيوفر بيئة لتفكير أكثر 
معيارية فيما يتعلق بكيفية تطور وتنظيم وإدارة مشهد البيانات. وق الوقت «ol JI‏ فإن 
الأخير يكون في الغالب تفاعلياء ومفهومًا بشكل ضعيفء وتسيطر عليه المصالح المكتسبة. 
لقد سعى هذا الكتاب إلى تقديم تحليل أولي ومفاهيمي بشكل متوازن» ونقدي وشامل 
والذي من الممكن أن يساعد على توجيه الدارسات التي تتبعه. ولوقت طويل للغاية 
فإن البيانات وتكوين وعمل المجاميع التي تحيط بالبيانات قد تم الآخذ بها على أنها آمور 
مسلم بهاء في حين أن الاهتمام كان Laro‏ على المعلومات وال معارف المستقاة منهاء فالوقت 
قد حان لتدارك هذا الإهمال. 
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المترجم في سطور 


د. محمد بن أحمد علي غروي 


المؤهل العلمي: 


- دكتوراه علوم المعلومات؛ جامعة نيويورك الحكومية: الولايات المتحدة الأمريكيةء Y * W‏ 


الوظيفة الحالية: 


أستاذ تقنية المعلومات المساعد في قطاع تقنية المعلومات بمعهد الإدارة العامة بالرياض. 


vog 


إنجاز العديد من الدراسات العلمية منها: 
Gharawi, M., & Khoja, M. (2015). Assessing Basic Computer Applications‏ 
Skills of College-Level Students in Saudi Arabia. International Journal of Social,‏ 


Behavioral, Educational, Economic and Management Engineering Vol: 9, No: 4. 
Gharawi, M., Estevez, E., Janowski, T (2014). Identifying government chief 


information officer education and training needs: the case of Saudi Arabia. DG.O 
2014: 280- 289 


Deosthali, K., Gharawi, M. & Potnis, D. (2014). Assessing Employee Satisfaction 
of the Electronic Training Program of the Gulf Cooperation Council's Countries. 
In Proceedings of World Conference on E-Learning in Corporate, Government, 


Healthcare, and Higher Education (pp. 488- 497). 


Gharawi, M., & Dawes, S. (2013). Exploring the Influence of Contextual Distances 
on Transnational Public Sector Knowledge Networks: A Comparative Study of 
AIRNow-I Shanghai and the Hajj-MDSS Initiatives. Paper presented at the 46th 
Hawaii International Conference on System Sciences (HICSS-46), Maui, Hawaii. 
Gharawi, M., & Pardo, T. (2012). Factors Influencing Exchange Activities 
in Transnational Knowledge Networks: The Case of the Hajj-MDSS. ACM 


International Conference Proceeding Series, 322, 113- 122. 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة:» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


10. 


11. 


12. 


13. 


14. 





AVA 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  EcoNLiBRARY‏ © 


Djoko, S., Jong, J, Nam, T. & Gharawi, M. (2012). Building the Academic 
Community of E-Government Research on Cross-Boundary Information 
Integration and Sharing. Paper presented at the 45th Hawaii International 


Conference on System Sciences (HICSS-45), Maui, Hawaii. 


Dawes, S., Gharawi, M., & Burke, B. (2012). Transnational Public Sector Knowledge 
Networks: Knowledge and Information Sharing in a Multidimensional Context. 


Government Information Quarterly, 29(1), 5112-0 


Dawes, S., Gharawi, M., & Burke, B. (2011). Knowledge and Information Sharing in 
Transnational Knowledge Networks: A Contextual Perspective. Paper presented at the 


44th Hawaii International Conference on System Sciences (HICSS-44), Kauai, Hawaii. 


Gharawi, M., & Dawes, S. (2010). Conceptualizing Knowledge and Information 
Sharing in Transnational Knowledge Networks. Paper presented at the 4th 
International Conference on Theory and Practice of Electronic Governance, 
Beijing, China. 

Rorissa, Demissie D., A., Gharawi, M. (2010). A Descriptive Analysis of Contents 
of Asian e-Government. In E-Government Website Development: Future Trends 
and Strategic Models. Ed Downey, SUNY College at Brockport: USA. 


Rorissa, A., Gharawi, M., Demissie D. (2010). A Tale of Two Continents: Contents 
of African and Asian E-government Websites. Proceedings of the 43rd Hawaii 


International Conference on System Sciences (HICSS-43), Koloa, Kauai, Hawai. 


Gharawi, M., Pardo, T., & Guerrero, S. (2009). Issues and Strategies for Conducting 
Cross-National E- government Comparative Research. ACM International 
Conference Proceeding Series, 322, 163- 170. 

Karshmer, A., and Gharawi, M. (2001). Computer Speech for Teaching Mathematics 
to the Blind, The International Conference for Education and Training, Prague, 
Czech Republic. 

Montilva, J., Hamzan, K., and Gharawi, M. (2000). The Watch Model for Developing 
Business Software in Small and Midsize Organizations, Proceedings of the SCI, 


Volume 1, Orlando, Florida. 





AA 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


أبرز الأنشطة العملية: 

.١‏ عضو اللجنة الرئيسية لمبادرة البرنامج الوطني للتدريب عن eY VV «iso‏ - الآن. 

.Y‏ عضو الفريق الوطني لبناء إطار حوكمة التعليم والتدريب الإلكتروني بالمملكة العربية 
السعودية. 1١١٠م.‏ 

.Y‏ عضو الفريق الدولى لدراسة احتياج المهارات الوظيفية» صندوق الموارد البشرية بالتعاون 
مع جامعة هارفرد. Y W-Y* VO‏ 

». عضو الفريق الوطني لقياس التحول للتعاملات الحكومية الإلكترونية (قياس) -Y «VO‏ 
الان. l‏ 

0. عضو الفريق الدولى لجائزة الإنجاز قي التعاملات الحكومية الإلكترونية (إنجاز) 6١١٠م.‏ 

5. عضو الجمعية الدولية. للحكومة الرقمية ٠١١١ (DG.O)‏ - الآن. 

V‏ مدير مشروع إثراء وتنويع مصادر المعرفة العربية ١٠١۲-الآن؛‏ معهد الإدارة العامة 
الرياض. 

۸. مشرف على برنامج التدريب الإلكترونى ۲۰۱۲ح YNE-‏ معهد الإدارة العامة» الرياض. 

.٩‏ باحث ومدير برامج 9١٠٠م te V NN-‏ مركز أبحاث التقنية الحكومية» 355555« الولايات 
المتحدة الأمريكية. 

EYW- تنفيذ عدد من الاستشارات للجهات الحكومية با مملكة العربية السعودية ۲۰۰۱م‎ .٠ 

gY * W-eY* * V تصميم وتطوير العديد من البرامج التدريبية في مجال تقنية المعلومات‎ . V! 

۲. المشاركة ف العديد من المحافل وال مؤتمرات ال محلية والإقليمية والدولية. 
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مراجع الترجمة في سطور 


د. ماجد بن عبدالعزيز البريان 
- الدكتوراة في مجال أنظمة المعلومات والتخطيط الإستراتيجي للمنشآتء جامعة سالفورد 
بريطانيا (Y)‏ 


الوظيفة الحالية: 
- أستاذ مساعد بقسم نظم المعلومات - كلية علوم الحاسب وا معلومات - جامعة الإمام 
محمد بن سعود الإاسلامية. 


الخبرات العلمية والعملية: 

- عمل عضو هيئة تدريس بقسم تقنية المعلومات والاتصالات بكلية الملك فهد الأمنية. 

- عمل محاضرا غير متفرغ مركز خدمة المجتمع بجامعة الإمام محمد بن سعود. 

- الإشراف ومناقشة عدد من رسائل ال ماحستير. 

- حضور ونشر عدد من المشاركات العلميه بعدد من المؤتمرات والمجلات العالية. 

- عمل مستشارا بهيئة الهلال الأحمر السعوديء ۲۰۱۷ - حتى الآن. 

- عضو فرق عمل ضمان الجودة لشركه QSR-International‏ فما بخص ضمان جودة 
واختبار برمجياتها (NVivo)‏ تطبيق إدارة وتحليل البيانات الوصفية. 

- العمل مستشار لأمانة مدينة الرياض ف تطوير مشروع مركز الاتصال ٠٤١‏ . 

- العمل مع إدارة تقنية المعلومات بالمؤسسة العامة للتقاعد على تحليل بعض المشاكل 
القانئمة. 

- العمل على تطوير أنظمة حاسوبية لشركة القصبي. 

- العمل والإشراف على تطوير عدة أنظمة حاسوبية تطبيقية بكلية الملك فهد الأمنية. 
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- القيام بدراسة تقييم تطبيقات أنظمة المعلومات من حيث النجاح والفشل ومن بينها 
نظام الإسعاف بمدينة لندن وكارثة (LASDS)‏ عام ۱۹۹۲م. 

- دراسة تحليلية لتطبيق نظام ERP‏ لإدارة عمل جمعية الهلال الأحمر التركية (TRCS)‏ 

- القيام بإعداد دورة تدريبية خاصة لطلبة الدكتوراة في قسم IRIS‏ بجامعة سالفورد فيما 
يخص العمل على نظام التحليل الوصفي للبيانات NVivo‏ 
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حقوق الطبع والنشر محفوظهة لمعهد الإدارة العامة ولا يجوز 
اقتباس جزء من هذا الكتاب أو إعادة dbb axb‏ صورة دون موافقة 


dols‏ من المعهد الا في حالات الاقتىاس القصبر بغرض النقد 
والتحليل» مع وجوب ذكر المصدر. 
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هدا الكتاب 

يهدف كتاب ثورة السبانات إلى تقدم 4 ل gode‏ ودقيق للبياتات وثورة البيانات الجارية حاليا 
فالكتاب يسعى. من جهة, لبن سنن لسري و الوس نئل المتعلقة بإعادة تشكيل إنتاج ومعالجة 
وخلبل وتبادل البيانات, وما pig‏ هذا لكيفية إنتاج واستخدام المعلومات والمعرفة: وهو. من 
جهة أخرى. مهد للنقاش والثفكبر التقدى حول الببانات من حبث طبيعتها. وكبيفبة تأطبرها 

من النواحى القنبة والفلسفية والأخلاقبة والاقتصادية والتجمبعات التقتية والمؤسسبة 
åhus]‏ بها ويستند التحليل المقدم قي هذا الكتاب الى مشاركة واسعة النطاق والى ما 
سمقه من مؤلفات فى مختلف sale]!‏ والعلوم الإنسانية, والعلوم الاجتماعبة. ومن مظطموعات 
الثتقافة الشعبية, والاصدارات الصحافبة. والدوربات الصناعبة: والى خبرة مباشرة فى العمل 
"TO PEE lia ishil c‏ وبتى خثبة ومشاريع كلبلات لسبانات على نطاق بمؤسسي ls‏ 
وبنمسم الكتاب الى pais 3a uu i‏ الفصل الأول å$‏ عامة b, Ss TOt"‏ حول poggio‏ 
السانات وكبيفبة فهم قواعد السانات والسبنى التحتبة للسانات, قى حبن ببحث الفضل الثاني قي 
الدور المستمرلليبانات الصعبرة والكيفبة التي تم بها توسيع نطافها إلى أرشيفات/محفوظات 


- ر‎ e وبنى ختية, الى أن وصلت الى درجة التدأول وبيعها من خلال وسطاء الببانات. كمابناقش‎ E TET 
>t ١ 002 النالت الداقع للتؤحة تحة استتحداث السانات المفتوحة والسبانات المرتبطة‎ Laai 
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والثامن الحجح المستخدمة لتعزبز البيانات ~x v‏ ; ش » 0 م 
NE 3 ١ "à t‏ 1 
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الفصلان الناسع والقاشر التحدبات و f ٠‏ :ا يوي حا و م (os‏ 
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